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Sur la Théorie des Systémes de Modulation Codée 
pour la Transmission Numérique à Débit Elevé. 


Le début est consacré à un арегси historique et le reste à des 
contributions personnelles. Le problème de reconstituer la phase de la 
porteuse a été envisagé pour les Modulations Codées en Treillis (MCT), 
aboutissant à une MCT différentiellement cohérente. Un étiquetage binaire 
optimal des symboles d'une constellation carrée a été introduit et une 
famille de constellations en croix généralisées étudiée. Des bornes fines 
de leurs performances ont été établies et leur efficacité spectrale a été 
évaluée. 


Utilisant le théoréme de géométrie des nombres de Minkowski- 
Hlawska, on a démontré un théorème de capacité pour le canal à bruit 
additif, blanc et gaussien, établissant ainsi l'existence de moyens 
déterministes pour approcher la capacité. 


Des bornes sur les performances des codes de réseau ont été 
obtenues. Une amélioration de l'approximation continue de Forney pour 
estimer la puissance moyenne normalisée à 2 dimensions a été suggérée. 
On a analysé le comportement de ces bornes pour un grand nombre de 
dimensions et conjecturé que s'approcher de la capacité est lié à la 
recherche de bons recouvrements plutót qu'à celle d'empilements denses. 


On a appliqué le raisonnement de Shannon basé sur le codage 
aléatoire à des constellations de nombre de dimensions fini. Les spectres 
de distance euclidienne de telles constellations ont été calculés. Un 
phénomène de durcissement de la distance a été trouvé. On a montré que 
l'affirmation "tous les codes sont bons" reste vraie pour les constellations 
codées. 
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RESUME 


La première partie de cette thèse est consacréc à un aperçu historique préalable et 
la seconde partie à des contributions personnelles. Les problèmes de récupération de la 
phase de la porteuse en modulation codée en treillis (MCT) ont fait l'objet d'une étude 
aboutissant à une MCT différentiellement cohérente. On a introduit un étiquetage binaire 
optimal des symboles des constellations carrées et étudié une famille de constellations en 
croix généralisées. Des bornes fines de leurs performances ont été développées et leur 
efficacité spectrale a été évaluée. 


En s'appuyant sur le théorème de géométrie des nombres de Minkowski- 
Hlawska, on a démontré un théoréme de capacité pour les codes de réseau sur le canal à 
bruit additif, gaussien et blanc, y compris son assertion négative. On a établi ainsi 
l'existence de moyens déterministes (codes fortement structurés) pour s'approcher de la 
capacité. 


Des bornes sur les performances des codes de réseau ont été établies. On a 
suggéré une amélioration de l'approximation continue de Forney utilisée pour estimer la 
puissance moyenne normalisée à deux dimensions. On a analysé en particulier le 
comportement de ces bornes pour un nombre de dimensions élevé, ce qui a conduit à la 
conjecture que le probléme de s'approcher de la capacité est lié davantage à la recherche 
de bons recouvrements qu'à celle d'empilements denses. 


L'accent a ensuite été mis sur le codage-modulation de constellations à nombre de 
dimensions fini. Dans cette perspective, on a appliqué à la modulation codée le 
raisonnement de Shannon basé sur le codage aléatoire et la critique du critére de distance 
minimale revendiquée par Battail. Les spectres de distance euclidienne de divers codages- 
modulations aléatoires ont été évalués. On a mis en évidence un phénoméne de 
"durcissement" de la distance normalisée dans les espaces euclidiens à grand nombre de 
dimensions, ce qui équivaut à une borne de Varshamov-Gilbert sur la distance 
euclidienne. En outre, оп a démontré que l'énoncé "tous les codes sont bons" est vérifié 
aussi pour les constellations codées. 


Les investigations menées dans cette étude aboutissent donc à proposer un 
meilleur aperçu du comportement asymptotique de la modulation codée. 


ABSTRACT 


The first part of this thesis is devoted to a preliminary historical overview while 
the second one contains personal contributions. The problem of carrier phase recovery is 
addressed in the case of trellis-coded modulation (TCM), resulting in a differentially 
coherent TCM. An optimum binary labelling of the symbols in square constellations has 
been introduced and a family of generalized cross constellations has been studied. Tight 
bounds on their performance were developed and their spectral efficiency was evaluated. 


By means of the Minkowski-Hlawska theorem of the geometry of numbers, we 
proved a capacity theorem for lattice codes over the additive white Gaussian noise 
channel, including its negative statement (strong converse). Therefore the existence of 
deterministic means (i.e., highly structured codes) to approach capacity was established. 


Bounds on the performance of lattice codes were obtained. An improvement of 
Forney's continuous approximation used in order to estimate the mean normalized two- 
dimensional power was suggested. We analyzed in particular the behaviour of these 
bounds for high dimensionalities, which led us to conjecture that the problem of. 
approaching capacity is connected with searching for good coverings rather than for 
dense packings. 


Emphasis was then put on coding-modulation for a finite number of dimensions. 
In this context, we applied Shannon's random coding argument as well as Battail's 
criticism of the minimum distance criterion. Euclidean distance spectra of several coding- 
modulation schemes were evaluated. A phenomenon of normalized distance "hardening" 
was found when the dimensionality increases, which can be interpreted as a kind of 
Varshamov-Gilbert bound on the Euclidean distance. Moreover, we showed that the 
statement "all codes are good" still holds for the coded constellations. 


The investigations carried out in this study thus result in proposing a better 
overview on the asymptotic behaviour of coded modulation. 


J'ai eu le privilège de conduire cette recherche au sein d’une des plus 
prestigieuses écoles de Télécommunications d'Europe et de travailler avec certains de ses 
plus renommés chercheurs. Cette thése est consacré à l'étude théorique des systémes de 
communications numériques à haut débit destinés à des canaux appartenant à la région 
limitée en bande passante, ce qui constitue la grande majorité des voies réelles. 
L'actualité, voire l'importance du sujet paraít incontestable: il s'agit de la plus grande 
révolution de la théorie (et de la pratique) des télécommunications depuis la publication 
des travaux fondamentaux de Shannon en 1948. 


La difficulté que j'ai éprouvée à la rédiger découle partiellement de la liberté 
d'action dont j'ai bénéficié pour la mener. J'ai méme eu du mal à choisir un titre 
approprié: celui que j'ai finalement adopté n'élucide pas complétement le contenu du 
mémoire. Cependant, sa diversité refléte ma pensée. Mon effort a été concentré sur la 
création, rechercher et créer étant à peu prés synonymes. Les résultat y sont présentés 
avec rigueur, ma non troppo. Ma réponse aux ingénieurs-mathématiciens “trop formels” 
est celle du génial O. Heaviside: "Eh bien, qu'en dites-vous? Doit-on refuser à se nourrir 
parce qu'on ne comprend pas tout le processus digestif?" (il n'y aura point de réponse à 
ceux qui m'accusent d'un formalisme excessif). 


Parmi quelques contributions faites dans le (beau) domaine de la modulation 
codée, deux points sont particuliérement mis en relief, à savoir: tout d'abord la 
démonstration de l'existence de bons codes de réseau (lattice codes) basée sur 
l'application du théorème de Minkowski de la géométrie des nombres. Ensuite, 
l'application à la modulation codée du concept de codage aléatoire, base du raisonnement 
qui conduit à la démonstration du théorème fondamental du codage de canal. 


Les investigations effectuées dans le cadre de cette thése sont destinées à fournir 
un meilleur aperçu du mécanisme du codage de jeux de signaux multidimensionnels et 
des performances qui en résultent. Les conclusions rejoignent clairement les idées du 
Prof. Battail à propos de sa remise en question de la validité du critére de distance 
minimale et de l'existence de moyens déterministes de codage imitant le codage aléatoire. 


Quoi qu'il en soit, j'ose dire que l'originalité y est présente. Alea ajact est. 


H. Magalhäes (Magellan) de Oliveira. 
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INTRODUCTION GENERALE 


V oici que prés d'un demi-si&cle s'est écoulé depuis l'énoncé par Claude 
Elwood Shannon des théorèmes fondamentaux de la Théorie de l'Information qui ont 
profondément changé notre compréhension de la nature du processus de communication. 
Ses nombreuses découvertes scientifiques, cela va sans dire, sont d'une élégance et d'une 
beauté rares. En proposant une mesure de l'information et une théorie digne de ce nom, il 
a élevé les télécommunications au rang des sciences. 


Il présentait une conception révolutionnaire des parties composant une chaine de 
communications, devenue aujourd'hui classique: une source d'information; un émetteur 
effectuant le codage (de source et de canal ) et la modulation; un canal ой s'ajoute un bruit 
aléatoire; un récepteur comprenant le démodulateur et les décodeurs; et finalement un 
destinataire. Nous nous sommes abstenu d'inclure dans cette thése la figure 
correspondante, présente dans 90% des ouvrages sur le codage, mais il y a fallu bien des 
efforts! 


Les principaux aspects étudiés par Shannon vont de la mesure de l'information 
jusqu'au cryptage (sans parler de l'intelligence artificielle), en passant par le théoréme 
d'échantillonnage, le codage d'une source discréte, le codage de canal, le codage de 
source avec critère de fidélité, les canaux à plusieurs terminaux. Cette thèse n'est 
consacrée qu'à une petite partie de cet univers fantastique: le codage de canal, c'est-à-dire 
le codage en tant qu'outil pour combattre le bruit ajouté pendant la transmission. 


Mais comment le bruit affecte-t-il l'information? Les ingénieurs de l'époque 
préshannonienne croyaient, sur la foi d'un apparent bons sens, que le bruit limitait 
toujours la qualité de la transmission, ce qui entraínait une passivité fataliste vis-à-vis du 
bruit. Cela est bien illustré par le passage [HAR 1928] “... external interference, which can 
never be entirely eliminated in practice, always reduces the effectiveness of the system" . 


Alors que l'on pensait que le bruit dégradait sürement l'information transmise, 
Shannon a montré qu'il n'en était rien. Il s'agissait alors d'une idée neuve qui reste 
aujourd'hui encore surprenante: le sens commun n'associe-t-il pas une transmission 
erronée à un canal bruyant? Shannon [SHA 19482, 19485) a prouvé que le bruit ne limitait 
que le débit d'information possible, sans imposer toutefois aucune limite à la qualité avec 
laquelle le message issu de la source peut étre restitué au destinataire. 
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Plus spécifiquement, Shannon démontrait le théoréme fondamental du codage de 
canal [SHA 1949] qui énongait que le bruit n'empéche pas de réduire autant qu'on le veut 
la probabilité d'erreur, à condition que le débit d'information reste inférieur à un débit 
maximal nommé capacité du canal. Sa brillante démonstration est fondée sur un 
raisonnement, dit de codage aléatoire, qui va être exposé dans la suite. La connaissance 
de moyens explicites pour obtenir de bons codes faisant défaut, il considérait la famille 
probabilisée de tous les codes d'un certain type et en calculait la probabilité d'erreur 
moyenne ou, plutót, une borne supérieure de celle-ci. L'énoncé du théoréme fondamental 
du codage de canal étant démontré pour cette moyenne, il existait alors au moins un code 
de la famille qui le vérifiait. Il s’agit cependant d'un théorème d'existence (non de 
construction). En effet, puisque sa démonstration s'appuie sur des moyennes faites sur 
des ensembles de codes tirés au hasard, elle ne propose aucune construction particuliére 
permettant de l'atteindre. 


En proposant un nouveau regard sur les systémes de communications, et ayant 
aussi établi toutes leurs limitations intrinsèques, Shannon ouvrait de multiples horizons 
pour les recherches, donnant naissance en particulier à une nouvelle classe de chercheurs, 
celle des “théoriciens du codage”. 


La clef du codage fut clairement exhibée par Shannon: il est plus avantageux 
d’attendre d’avoir plusieurs points puis de les décoder ensemble en les considérant 
comme un point d’un espace ayant un grand nombre de dimensions que de les décoder au 
fur et à mesure de leur arrivée. 


La probabilité d’une transmission sans erreur étant établie, les moyens de 
l'atteindre par une construction explicite devenaient objet de recherche. Les études de 
codage ont donc abouti à tout un arsenal de moyens et se sont avérées d'une fécondité 
surprenante [BER 1974]. La premiére classe de codes découverte, celle de Hamming, a 
méme été citée par Shannon à titre d'exemple [e.g., WEA&SHA 1949]. Au début des 
années 40, les Bell Telephone Lab. utilisaient déjà un code détecteur d'erreur similaire au 
code de parité (5,4) dans deux ordinateurs à relais [THO 1983]. Au début des années 50, 
Richard Hamming, en tant que chercheur chez Bell, a été amené à se poser la question: 
“Damn it, if the machine can detect an error, why can't it locate the position of the error 
and correct it?" [THO 1983]. Il créa alors les premiers codes binaires capables de corriger 
automatiquement des erreurs [ibidem]. Presque simultanément, Marcel Golay découvrait 
les seuls autres codes parfaits existants. D'autre part, David Slepian exhibait et exploitait, 
en 1957, la structure linéaire de code en bloc. Les moyens explicites de codage 
commencaient leur longue carrière. 
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Les débuts des années 60 furent profondément marqués par le développement de 
trés puissantes techniques algébriques de codage: les codes BCH, les codes de Reed- 
Solomon (notés ici codes RS [REE&SOL 1960]) ainsi que les codes de résidu quadratique. 
La fin de cette période coincide avec l'apparition de l'algorithme de décodage de 
Berlekamp [voir BER 1984). Les années 70 ont vu l'invention des codes de Goppa, des 
codes alternants et de bien d'autres généralisations [BER 1984]. | 


Dans le cadre du codage par correction directe des erreurs (FEC), deux stratégies 
sont utilisées: d’une part, les codes en bloc avec de fortes propriétés algébriques, et 
d'autre part les codes convolutifs (pour un point de vue intéressant à ce propos, voir [BAT 
1984]). 


La classe des codes convolutifs fut créée en 1954 par Peter Elias (au MIT). Le 
décodage séquentiel, pertinent à cette classe de codes, s’est développé fortement au début 
des années 60, en particulier avec les contributions de Wozencraft, Fano et Jelinek. 
Cependant, il a fallu attendre jusqu'en 1967 pour que l'outil le plus puissant de la théorie 
et de la pratique du codage soit découvert: l'algorithme de Viterbi, le plus remarquable 
développement du codage depuis sa création [VIT 1967]. D'autre part, l'utilisation des 
sondes spatiales a fourni une formidable incitation au développement du codage de canal. 


Du point de vue du décodage, l'exploitation de propriétés algébriques exige des 
opérations sur les symboles de l'alphabet discret du code. Cela implique une décision 
préalable sur les signaux reçus, qui remplace leur position vraie dans l'espace des 
signaux par la donnée du point de la grille utilisée au codage qui en est le plus proche. 
Cette décision, dite “ferme”, implique la perte de la marge qui renseigne sur sa fiabilité. 
De meilleures performances sont obtenues avec des techniques qui utilisent l'information 
probabiliste reçue et que l'on désigne par décodage souple ou à décision pondérée. 
L'avénement de la pondération dans les algorithmes de décodage constitue une importante 
étape dans les progrès du codage. En France, Battail à été le plus important défenseur et 
propagateur de cette idée. L’adaptation du décodage en treillis (dite du type Viterbi) aux 
codes en bloc a été développée principalement par Battail et Wolf [BAT&DEC 1976, BAH et 
al. 1974, WOL 1978, BAT 1983]. | 


La fonction du codage peut être interprétée de deux façons distinctes. Si l’on 
suppose que le rapport signal à bruit est fixé, une augmentation du débit entraîne une 
dégradation des performances. Le codage apparaît alors comme un moyen d’améliorer le 
débit sans dégrader la qualité de transmission. Si l'on admet que c'est le taux d'erreur 
souhaité que l'on fixe, une augmentation du débit entraine un besoin accru de rapport 
signal à bruit. Voilà le codage envisagé comme moyen d'épargner de la puissance de 
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l'émetteur. 


* LE CODAGE EFFICACE AVEC LIMITATION DE BANDE. 


Etant donné un canal de bande passante B, on voit aisément que la seule facon 
d'augmenter son débit d'information est d'en accroître l'efficacité spectrale. Cela entraîne 
l’emploi de constellations à grand nombre d’états, c’est-à-dire une augmentation de la 
taille de l’alphabet des symboles. En admettant un rapport signal-à-bruit fixé (car le canal 
est donné), il en résulte naturellement une dégradation de la performance du système, 
exprimée par sa probabilité d'erreur. En effet, les différents signaux deviennent de moins 
en moins discernables. Dans ce cas, la nécessité du codage apparait clairement pour 
améliorer la performance en réduisant le taux d'erreur à des niveaux tolérables. 


Lorsqu'il est fait allusion à l'introduction de redondance, un premier défi se pose. 
Pour une taille donnée de l’alphabet, la redondance ne peut être introduite qu'en 
augmentant le nombre des symboles émis. Cela se traduit soit par une perte en débit utile, 
soit par une augmentation de la bande de fréquences exigée pour la transmission du 
signal. 


La première constatation qui s'impose est hélas qu'on ne peut jamais s'approcher 
de la capacité du canal en utilisant les techniques classiques. En effet, l'augmentation de 
la largeur de bande n'est pas permise dans des canaux à bande étroite. Par ailleurs, méme 
si l'on accepte un élargissement de la bande, ceci revient à changer le canal et donc sa 
capacité! La "réduction du débit utile de transmission" pour loger la redondance n'est 
guére attrayante et s'avére paradoxale, car on souhaite l'augmenter. Ainsi, dans la 
majorité des applications pratiques, le gain de codage n'était obtenu qu'au prix d'un 
élargissement du spectre, ce qui soulevait la question de la possibilité d'appliquer le 
codage aux canaux à bande étroite et éloignait le codage du paradis shannonien. 


Cette contradiction inhérente au processus classique de codage a longtemps 
différé l'application des codes correcteurs d'erreurs aux canaux à bande étroite. A cela 
s'ajoute un argument développé par Forney [FOR 1970] selon lequel on parvenait, sans 
codage, à s'approcher de la capacité au fur et à mésure que l'on pénétrait dans la région 
limitée en bande passante. Cela explique en partie l'inexistence de systèmes codés opérant 
sur le circuit téléphonique (par exemple dans les MODEMS). 
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D'autre part, les canaux de satellites sont bien modélisés par du bruit blanc 
gaussien avec un rapport signal à bruit assez faible (typiquement quelques décibels) et 
une bande passante assez large, oü la puissance coüte quelques centaines de milliers de 
dollars par décibel. La premiére application du codage de canal à grande échelle a été le 
code d'Odenwalder, un code convolutif (2,1) de longueur de contrainte 7, sur des canaux 
de satellite [e.g., WU et al. 1987]. Cela n'est pas surprenant dans la mesure où cet 
ensemble de caractéristiques est trés favorable à l'application du codage. En 1982, des 
codes de Reed-Solomon furent incorporés dans les normes des télécommunications 
spatiales [YUE 1990]. La limitation de largeur de bande ne se faisant pas sentir à l'époque, 
ces canaux furent considérés comme limités en puissance. Ainsi, ce n'est pas par hasard 
que les techniques classiques de codage n'ont eu de réussite remarquable que dans le 
domaine des télécommunications spatiales et par satellite. Les sceptiques à propos du 
codage affirmaient alors “Coding is dead except for the deep-space channel” [MAS 1974]. 
А présent, méme ces canaux sont considérés comme limités en bande passante et les 
nouvelles techniques dont traite cette thése sont préférables [HAG 1989, YUE et al. 1990]. 


Ainsi, pendant longtemps, le codage est apparu comme un palliatif, une technique 
pour faire passer la qualité des données de problématique à acceptable, le prix à payer 
étant une réduction du débit utile ou une augmentation de bande passante. Or, Shannon 
avait démontré que le seul prix à payer pour réduire le taux d'erreur est un accroissement 
de la complexité du décodeur, pourvu que le débit utilisé soit inférieur à la capacité du 
canal. 


Pourrait-on s'affranchir de ces difficultés? La réponse n'est venue que beaucoup 
plus tard. Il fallait donc développer des techniques permettant d'améliorer les 
performances d'une transmission numérique sans exiger ni une plus grande largeur de 
bande passante, ni un sacrifice sur le taux d'émission de l'information utile (cela 
paraissait plutót impossible aux yeux des ingénieurs de l'époque). 


La nouvelle révolution ne s'est produite qu'à la fin des années soixante-dix / 
débuts des années quatre-vingts gráce à l'ingénieuse idée de Gottfried Ungerboeck [UNG 
1976] qui à permis de sortir de cette impasse et a complétement changé le statu quo du 
codage. Le premier pas dans cette direction a consisté à considérer des techniques de 
codage où la redondance est introduite par en élargissant le jeu de signaux utilisé au lieu 
d'ajouter des symboles de parité. Cette facon de procéder, ой la redondance est obtenue 
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par l'emploi d'un espace des signaux plus grand que celui qui est nécessaire à la 
modulation non codée, est aujourd'hui appelé codage avec expansion de l'alphabet . La 
deuxième étape a consisté à réaliser conjointement la conception du code et celle de la 
modulation. Cela est devenu réalisable à l’aide d’une technique développée par 
Ungerboeck et nommée “partition des ensembles" (ser partitioning). Une démonstration 
rigoureuse que les codes d’Ungerboeck n'entrainent pas d'élargissement de la bande a 
été présentée par Biglieri [BIG 1986]. 


Bien entendu, pour gagner en débit sans dégrader les performances, il faut payer 
un prix. Car, fort insidieusement, il se trouve que plus la Ғасоп de coder s'approche de 
l'idéal, plus les délais deviennent longs lors du processus de décodage. Les promesses 
ultimes de la théorie ne sont atteints qu'asymptotiquement en construisant des jeux de 
signaux (codes) dans des espaces à nombre de dimensions trés élevé. Le but de cette 
thèse est principalement de contribuer à rendre plus compréhensible le mécanisme du 
codage avec des constellations de signaux de dimension finie et de fournir quelques 
réflexions géométriques à propos des phénoménes particuliers aux espaces euclidiens à 
nombre de dimensions trés élevé. 


Les transmissions de données ont connu une véritable explosion, particuliérement 
due à l'usage intensif des ordinateurs qui caractérise l'époque actuelle. Par conséquent, 
les besoins en débit d'information se sont accrus. Le codage de canal s'avére maintenant 
indispensable. Néanmoins, 11 n'est pas facile de s'approcher de la capacité, objectif trés 
difficile à atteindre à cause de la complexité intrinsèque des algorithmes de décodage 
[e.g., BER et al . 1978]. 


L'emploi pratique de systémes de codage élaborés devient de jour en jour plus 
attrayant du point de vue économique et cette tendance parait destiner à continuer. On 
peut, en parodiant J.K. WOLF, affirmer “People who reach(ed) the conclusion that coding 
is (was) dead are (were) dead wrong". 


TRAVAUX ANTERIEURS 


“It is better do the right problem the wrong way 
than do the wrong problem right way" R.W. HAMMING. 


CHAPITRE I 


INTRODUCTION AUX SYSTEMES 
DE MODULATION CODEE 
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L1. BREFS RAPPELS SUR L'HISTOIRE DES COMMUNICATIONS. 


11.1 ANCIENNE HISTOIRE DES TRANSMISSIONS NUMERIQUES. 


On présente tout d'abord quelques notes historiques dont le but est de décrire 
brièvement l'évolution des systèmes de télécommunications numériques en exhibant 
d'anciennes réalisations parmi les plus importantes qui concernent la théorie des 
communications numériques. L'apergu est à la fois trop rapide et incomplet. 


En 1623, Francis Bacon constatait que l'homme pouvait communiquer à distance 
au moyen de simples signaux binaires. En 1771, Chappe expérimentait un sémaphore (dit 
télégraphe visuel) entre les municipalités de Parce et Brulon. Son systéme utilisait 
initialement un alphabet de 26 signaux, qui a ensuite été porté à 66 symboles, dont les 
lettres majuscules, minuscules et quelques chiffres. Son développement [cf. STU 1984] est 
présenté dans le tableau I [ANDR 1989]. 


TABLEAU I. EVOLUTION DES SEMAPHORES. 


mum 


1795 Lord Murray Londres - Portsmouth, 
Pl outh, Live DO ol 
1795- Napoléon Toute la France 
ЕЕЗ 
-ш- Frédéric IV de Prusse Berlin - Coblence 
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En 1809, Samuel Thomas Soemmering a construit en Bavière le premier 
télégraphe électromécanique. Le développement du télégraphe électrique est esquissé dans 
le tableau II ci-dessous. Déjà en 1845, des connections télégraphiques étaient disponibles 
entre Paris et Rouen, ainsi que Londres ct Porthmouth, par exemple. Lo télégraphe 
électrique fut ensuite sensiblement amélioré par W. Siemens en Allemagne. 


TABLEAU II. EVOLUTION DU TELEGRAPHE ELECTRIQUE. 


1832-1835 Paul Schilling Von ЕЗ 
Canstatt | 
1833 jusqu'à 1838 | C. Friedrich Gauss 


et W. Weber 


: 1836 Willian Cooke et 
i: Charles Wheatstone 


| sur | sam 8, mone 





En 1851, la France, la Belgique et la Prusse signaient un pacte sur le trafic 
télégraphique, auquel plusieurs pays ont ensuite adhéré. Entre 1850 et 1851, un cáble 
maritime était lancé entre Douvres et Calais. En 1865, l'Union Télégraphique 
Internationale - UTI a été créée à Paris [BEL et al. 1984]. Elle adopta, en 1903, les appareils 
du type Baudot (un code avec 5 impulsions par lettre, créé en 1874). Le premier cáble 
transocéanique était lancé par l'américain Cyrus W. Field en 1866 aprés de nombreuses 
péripéties [ZWE 1990]. 


Entre 1895 et 1901, Guglielmo Marconi (prix Nobel 1909) a perfectionné son 
télégraphe sans fil. Les télécommunications numériques changeaient définitivement de 
visage. La premiére communication radioélectrique transocéanique par satellite a eu lieu 
entre Holmdel, New Jersey, et la station française de Pleumeur-Bodou, en 1962 [IEEE 
Comm. Mag, May 1984 p.23]. 
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L'idée d'une mesure quantitative de l'information fut avancée en 1918 par 
Hartley. Il définissait la quantité d'information comme égale au logarithme du nombre des 
séquences de symboles permises [HAR 1918]. En 1928, Nyquist a montré que la 
transmission de signaux télégraphiques à un débit donné exige une certaine bande 
passante [NYQ 1928]. En termes plus précis, la bande spectrale minimale nécessaire à une 
interprétation non ambigué est égale au débit numérique en symboles/seconde (bauds) et 
ne dépend pas de la taille de l'alphabet de symboles (nombre de niveaux d'amplitude 
employé). Ce résultat, étroitement lié au théorème d'échantillonnage, a été formellement 
démontré par Shannon [OLI et al. 1948, SHA 1949]. En 1920, С. Valensi (France) a 
développé la première suggestion sérieuse pour le multiplexage temporel de canaux 
téléphoniques. Il a offert son idée aux Etats-Unis en reconnaissance de leur aide lors de la 
166 guerre mondiale [MIL 1984]. En 1937, l'anglais А.Н. Reeves concevait, aux 
laboratoires de 1'ITT à Paris, l'idée de la modulation d'impulsion en amplitude (MIA). En 
1945, Mr. Deloraine inventait en France le multiplexage temporel (MDT) [STU 1984]. 


Les modulation numériques ont évolué: les plus anciens systémes ont utilisé la 
modulation par déplacement de fréquence (MDF) et la modulation en phase (MDP). 
Ensuite Campopiano et Glazer ont introduit une technique combinant la modulation en 
amplitude et en phase pour la communication numérique [CAM&GLA 1962], développant 
les modulations appelées aujourd'hui Modulation d'Amplitude en Quadrature (MAQ). 


De nombreuses approches ont été utilisées pour développer des constellations à 
deux dimensions. Le probléme d'optimiser des jeux de signaux à deux dimensions avec 
des composantes en phase et en quadrature (du genre MAQ) sous une contrainte de 
puissance a été abordé en utilisant une procédure de recherche du gradient minimal. Les 
constellations optimales à deux dimensions ainsi obtenues ont apporté des gains d'énergie 
moyenne de l'ordre de 0,5 dB par rapport aux modulation MAQ classiques [FOS et al. 
1974]. Les performances de la modulation numérique en Amplitude et Phase avec un 
alphabet M-aire ont été étudiées en supposant une détection cohérente dans un canal à 
bruit gaussien. Diverses configurations de constellations (de taille M allant de 4 à 128 
points) ont été étudiées en ce qui concerne la probabilité d'erreur par symbole et le rapport 
signal à bruit, moyen et de créte. Les dégradations causées par les non-linéarités aprés le 
passage du signal modulé dans un amplificateur du type Tube à Ondes Progressives 
(TOP) furent aussi examinées [THOM et al. 1974]. Cependant, les faibles gains apportés 
par l'optimisation de la modulation indiquaient que l'avenir des transmissions numériques 
était lié au codage. 
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L1.2L'IDEE ET L'HISTOIRE DE LA MODULATION CODEE 


“The recognition that coding is useful on bandwidth- 
limited channels is a recent phenomenon and stems 
from the remarkable successes achieved by 
Ungerboeck, whose pioneering paper ... where it 
opened the eyes of many engincers to new 

possibilities for coding” J. MASSEY. 


La théorie de 1a modulation codée est un domaine fort fascinant, résultat 
d'une “alchimie” entre la théorie du codage correcteur d'erreurs et des techniques de 
modulation numérique. Cette hybridation s'est avérée d'une fécondité surprenante et l'on 
Observe aujourd'hui une véritable explosion d'intérét à propos de ce sujet. La clef de son 
succès réside dans le projet conjoint d'un code lié à une modulation de façon à bien les 
adapter au bruit du canal. Son invention remonte à Ungerboeck après une épopée 
remarquable que l'on va maintenant résumer. 


La modulation codée en treillis (MCT) a été pour l'essentiel congue par 
Ungerboeck en 1976 [UNG&CSA 1976]. Son article original, proposé aux ГЕЕЕ Trans. 
Info. Theory, n'a pas été immédiatement accepté. Cependant, quelques temps après, 
l'apport des nouveaux concepts est devenu de plus en plus évident, et les éditeurs ont 
reconsidéré leur décision initiale! [CAL 19902]. En conséquence, l'article d'Ungerboeck a 
été enfin publié en 1982 [UNG 1982], gagnant par la suite le prix du meilleur article (best 
paper award ) du groupe de théorie de l'information de l'IEEE. П ne fait aucun doute que 
toute la conception des systémes numériques codés a connu alors une véritable 
révolution. 


Le premier défaut du codage classique, tel que nous l'avons décrit dans 
l'introduction générale, découlait de la fagon inadéquate d'apporter la redondance, 
interdisant une utilisation efficace de la capacité offerte par le canal. D'autre part, la 
difficulté à trouver des moyens de codage efficaces venait aussi du fait que leur 
construction était basée sur des codes, principalement algébriques, conçus 
indépendamment de la modulation. On mentionne que l'idée que la maximisation de la 
distance libre de Hamming n'était pas un bon critére pour le projet de codes performants 
destinés au canal gaussien était plus ou moins répandue à l'époque. Néanmoins, le 
codage continuait à se développer (comme à son origine) en tant que mathématique 
discréte, s'éloignant de sa raison d'étre: le canal. 
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Massey fut un des pionniers à reconnaître que le codage et la modulation devraient 
être envisagés dans leur ensemble et non comme des entités isolés [MAS 1972]. Ne se 
contentant pas de reprocher verbalement le pessimisme quant à l'avenir du codage, il 
proposa une autre direction pour aborder le probléme (vox clamantis in deserto). 
Ungerboeck, étant aussi à Zurich (chez IBM), a pris connaissance de ces idées et 
probablement a saisi leur importance. Par la suite, il a fait un séjour sabbatique au Centre 
d'Etudes et Recherches IBM, La Gaude, France. Là, ses intéréts de recherche se sont 
portés vers le codage de canal [WOL&UNG 1986,p.773] et plus particuliérement vers son 
rapport étroit avec la modulation . 


A cet égard Digeon, qui travaillait à ГІВМ à la méme époque, remarqua [DIG 1976) 
“А bande passante du canal constante, à vitesse de modulation constante, à rapport signal 
sur bruit en puissance moyenne constant, nous pouvons envisager d'améliorer la 
probabilité d' erreur de la fagon suivante: si nous doublons le nombre de signaux de notre 
modulation, sous les hypothèses précédentes ...” (sic). 


Dès les premiers résultats basés sur un système codé à huit niveaux d'amplitude, 
comparé à une modulation non codée à quatre niveaux d'amplitude [DIG 1976, DIG 1977], 
il trouva des gains de codage significatifs. Cela montrait définitivement que, 
contrairement à ce que l'on avait cru, le gain apporté par le codage pouvait compenser la 
perte causée par l'élargissement de l'alphabet. Il rejoignait l'idée de Massey que la 
recherche d'un code ayant de bonnes caractéristiques doit se faire en liaison avec l'étude 
de la modulation. 


Ungerboeck s'est donc proposé d'utiliser la technique de codage ой la redondance 
est introduite par l'élargissement du jeux de signaux (c'est-à-dire l'extension de l'alphabet 
de la constellation) au lieu d'ajouter des symboles/bits de parité, afin d'éviter d'augmenter 
la largeur de bande. Cette étape franchie, la difficulté suivante consistait alors à choisir un 
code-modulation (selon les idées de Massey, par exemple) bien adapté au bruit. Comment 
le pouvait-on ? Dans le cas de bruit blanc gaussien, il s'agissait de construire des codes 
garantissant une bonne distance (libre) euclidienne plutót que de Hamming. Ici apparait la 
contribution magistrale d'Ungerboeck: la technique de partition des ensembles décrite 
dans la prochaine section. | 


L'importance du formidable travail d'Ungerboeck a été telle qu'il a créé un 
nouveau sujet de recherches en théorie de l'information: la modulation codée, objet de 
cette thése. Néanmoins, il conviendrait de remarquer qu'il y a deux approches différentes 
au probléme de la modulation efficace en bande passante combinée au codage. D'abord, 
la "Modulation à Phase Continue" (MPC) développée par Sundberg, Aulin et Anderson 
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[SUN 1986, WIL 1986], ensuite la "Modulation Codée en Treillis" d'Ungerboeck. La 
premiére approche consiste en une classe de schémas de modulation numérique à 
amplitude constante où le codage est conçu conjointement avec la modulation dans le but 
de maximiser la distance cuclidienne minimale. On impose la continuité aux variations de 
la phase du signal (support de l'information) et des spectres assez étroits découlent de 
cette contrainte. En outre, l'amplitude constante constitue un avantage pour la 
transmission dans des canaux à forte non-linéarité. Quoique une vaste littérature ait été 
consacrée à ce sujet [AND et al. 1986], il ne sera pas abordé dans cette étude. Cela pourrait 
en soi faire l'objet d’une thèse. D'ailleurs, le codage МСТ s'est avéré beaucoup plus 
performant et moins complexe que les MPC, et il devient méme de plus en plus évident 
qu'il est supérieur dans la plupart des applications pratiques du codage de canal. 


En outre, il faut aussi accorder de l'importance à un autre point acquis 
définitivement par le travail d'Ungerboeck. Il s'agit de comparer différents systèmes dans 
des conditions de méme débit d'information et bande passante, autrement dit, des 
systèmes de même efficacité spectrale. Cela permet une comparaison nette et équitable 
pour évaluer le gain du codage. 


La modulation codée peut être mise en œuvre à l'aide des codes convolutifs, ce 
qui a pour résultat la modulation codée en treillis (MCT) ou bien par l'intermédiaire des 
codes en bloc, ce qui est connu comme modulation codée en bloc (MCB). Ayant ainsi 
esquissé quelques détails sur sa création, nous allons consacrer la prochaine section à 
décrire briévement la méthode utilisée par Ungerboeck. 
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L1.3 L'EVOLUTION DES MODEMs. 


De toute évidence, une demande croissante pour des débits numériques 
élevés se manifeste dans l'évolution de la téléinformatique. L'importance de 1а 
transmission de données par voie téléphonique augmente jour aprés jour et le besoin de 
codage se fait sentir d'autant plus que le débit s'accroit. Les techniques étudiées dans 
cette thèse sont devenues fondamentales dans ce domaine, et se sont montrées de très loin 
supérieures au codage classique. Bien entendu, l'augmentation du débit peut permettre 
des économies sensibles sur le nombre de lignes louées ainsi que la création de nouvelles 
applications. Le canal téléphonique présente une largeur de bande grossiérement comprise 
entre 300 et 3400 Hz avec un rapport porteuse à bruit de l'ordre de 20 à 30 dB 
(typiquement 26 dB). 


Les premiers MODEMS ont été conçus chez BELL entre la moitié et la fin des 
années 50. Ils étaient à trés faible débit, 300 et 600 bits/s, et la modulation numérique 
utilisée était la modulation binaire par déplacement de fréquence MDF. 


Pendant la décennie 60, de nouveaux modems à débit numérique moyen (1200, 
2400 et 4400 bits/s) furent développés avec des modulations de phase MDP. Le succès 
commercial des MODEMS à haut débit (> 9 600 bps) a commencé en 1970 avec le CODEX 
9 600, utilisant une modulation MAQ. Les chercheurs ont concentré leurs efforts pour 
trouver de nouvelles techniques augmentant le débit et améliorant la fiabilité des 
transmissions numériques. Plusieurs entreprises ont donc tenté, sans aucun succes, 
d'incorporer les techniques classiques du codage correcteur d'erreur dans le projet de 
MODEMS en vue d'augmenter le débit sans une dégradation excessive de performance. 


On a cru jusqu'à la fin de cette.décennie que des débits numériques plus élevés ne 
seraient jamais possibles dans des systèmes commerciaux. А ce propos Holsinger [HOL 
1977] remarque “Sad but true for engineers of the world, the days of dramatic speed and 
performance breakthroughs were over almost as soon as they began" (sic). Le discours 
des experts pourrait étre résumé ainsi: "De toute évidence, le canal téléphonique impose 
de sévères limitations aux performances des modems; en pratique, un débit de 9600 bits/s 
aparait comme la limite ultime pour une transmission fiable de données dans les voies 
disponibles" [HOL 1977, NYM et al. 1982]. 
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Au début des années 80, la première génération de MODEMS à haut débit, à 14400 
bits/s, est apparue chez PARADYNE, congue à partir d'une modulation MAQ 64 non codée 
sur lignes spécialisées. Elle a été suivic, сп 1981, par Іс CODEX 14 400 avec unc 
constellation bidimensionnelle hexagonale [FOR er al. 1984]. Quoi qu'il en soit, les 
performances atteintes sur le canal téléphonique n'étaient pas assez bonnes pour justifier 
l'idée que des débits supérieurs à 9 600 bits/s seraient largement introduits sur le marché. 


Un très lucide rappel sur l'introduction du codage dans les modems sur le canal 
téléphonique est présenté par Ungerboeck [UNG 1987a,1987b]. Les premiers MODEMs 
commerciaux à MAQ codée en treillis sont apparus en 1984, fonctionnant au débit de 
14400 bits/s. Maintenant, un code non linéaire en treillis à 8 états [WEI 1984b] avec un 
gain de 4 dB a été adopté dans les normes du CCITT pour les modems à 9 600 bps sur 
réseau téléphonique public à 2 fils (14,4 kbps sur des lignes spécialisées à 4 fils). La 
non-linéarité est introduite pour permettre une protection contre les ambiguités de phase 
de 90? [norme V.32, CCITT 1989]. Ce codage-modulation est illustré par les figures 1 et 2. 
L'application de la modulation codée aux canaux téléphoniques ne se résume pas aux 
seuls codes en treillis. En 1986, un MODEM à 14 400 bits/s sur des lignes spécialisées 
basé sur le codage de réseau (le réseau de Gosset Eg) a été commercialisé par 
MOTOROLA. 












addition 
binaire 





ZO“ anru 





Codeur différentiel Codeur convolutif non linéaire 


Figure 1. Codeur non-linéaire de Wei en treillis à 8 états adopté par les normes du CCITT 
pour un MODEM à 9600 bps destiné à la transmission MCT / MAQ 32 (efficacité spectrale 
4 (bits/s)/Hz) sur le canal téléphonique. 
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Figure 2. Application bits / symbole pour la modulation codée utilisée par la norme V.32 
du CCITT associée au codeur ci-dessus. 


Les premiers MODEMs commerciaux à ultra haut débit, soit 19 200 bits/s, ne sont 
apparus qu’aprés le développement de la technique de modulation codée en treillis 
multidimensionnel de Wei. 


L'histoire du développement des MODEMS sur canal téléphonique est bien 
esquissée par Pahlavan et Holsinger, et son évolution peut étre divisée en 4 étapes 
[PAH&HOL 1988, aussi FOR et al. 1984]. D'abord, une première étape que va des années 
1920 au milieu des années 1950; une deuxième étape qui commence au milieu des années 
1950 et finit au début des années 1970; ensuite une troisiéme étape correspondant aux 
années 1970; et enfin une quatriéme étape allant du début des années 1980 à nos jours. 


14% étape: 


Cette période est profondément marquée par les études fondamentales sur les 
limitations de débit de transmission dues à la dégradation du signal introduite par les 
distorsions du canal. Essentiellement, on trouve les idées de Hartley et Nyquist [HAR 
1928, NYQ 1924, NYQ 1928]. 
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• 2 ème étape: 


Les premiers modems commerciaux sont apparus chez Bell au débit numérique de 
300 bps, puis de 1200 bps. Une modulation par déplacement de fréquence MDF était 
utilisée, De nouvelles techniques de modulation ayant un rendement spectral supéricur 
furent introduites pour répondre à la demande accrue de transmissions numériques, ainsi 
que de nouvelles techniques de synchronisation de porteuse et de rythme. L’égalisation, 
d'abord manuelle puis adaptative, a été introduite. Tout cela a permis d'élargir la bande de 
fréquences utilisée de 1200 Hz à 1600 (puis 2400) Hz. 


• 3 ème étape: 


Cette étape est surtout marquée par l’apparition de l’égalisation fractionnée, des 
annuleurs d'écho et l'utilisation de processeurs de traitement du signal [STE 87, BIN 88]. 
Les développements technologiques ont abouti à une réduction considérable de la taille 
des équipements. Au cours des années 70, plusieurs entreprises ont tenté, sans succès, 
d'incorporer des techniques classiques de codage correcteur d'erreur dans le projet de 
MODEMS. Plusieurs MODEMs à 9600 bps ont été développés avec un égaliseur auto- 
adaptatif, des annuleurs d'écho puissants et méme du codage convolutif traditionnel avec 
décodage basé sur l'algorithme de Viterbi. Le gain atteint par le codage dissocié de la 
modulation n'était que d'environ 1 à 2 dB. Le MODEM est devenu un outil banal dans la 
communication de données, ayant pour principaux fabricants: Intertel, IBM, General 
Datacomm, Codex Coorporation, Paradyne, Bell Systems, MOTOROLA etc. 


La transition de cette période vers la suivante est marquée par PARADYNE. La 
qualité des lignes téléphoniques ayant été aussi sensiblement améliorée, une transmission 
à 14 400 bits/s a été réalisée avec la MAQ 64. 


+ 4 ème étape: 


En 1985, un MODEM à 19 200 bits/s a été produit chez NEC [HIR 1985]. L'idée 
utilisée y consistait essentiellement à utiliser en paralléle plusieurs sous-canaux 
orthogonaux dans les 3 kHz de bande du canal téléphonique, système dit multiporteuse 
[HIR 1980, HIR 1981]. Pour un grand nombre de tels sous-canaux, l'égalisation 
d'amplitude et de phase dans chacun d'eux devient trés simple, puisque la fonction de 
transfert y est avec une bonne approximation une fonction affine de la fréquence. 
Cependant, ces MODEMS exigent des circuits de synchronisation et des techniques de 
récupération de phase assez élaborées et utilisent un grand nombre de porteuses pilotes 
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pour composer les signaux de synchronisation. 


Des MODEMs à 19 200 bits/s ayant un plein succès commercial ne furent 
fabriqués qu'aprés la parution du sensationnel article de Wei sur la MCT 
multidimensionnelle, qui a permis la mise en œuvre de codes du type d'Ungerboeck avec 
une petite expansion de l'alphabet [WEI 1987]. On décrit briévement dans la suite quelques 
détails techniques d'un tel MODEM sur lignes spécialisées à 4 fils [Cf. WEI 1987 p.494, TAN 
€t al. 1987, BAU&MIT 1989]. П met еп œuvre un codage en treillis trés perfectionné. Le 
système utilise une modulation de phase et d'amplitude d'une porteuse à 1 850 Hz et un 
égaliseur fractionnaire automatique 3T/4 pour compenser les distorsions provoquées par 
la ligne en bord de bande. La modulation, dite MAQ généralisée, emploie une 
constellation en croix de 160 points. Le filtrage est réalisé par un filtre en cosinus 
surélevé à coefficient d'arrondi trés petit, de l'ordre de 0,09375. La fréquence de 
modulation n'a pas la valeur traditionnelle de 2 400 Hz: elle vaut 2 742,86 Hz ( 2 400 
multiplié par 8/7). 


--—— 2742,6 --- 


AA+ HE 


300 1850 3400 
478,57 3221,43 


Figure 3. Utilisation de la bande téléphonique pour les MODEMS à 19,2 kbits/s. 


Un signal codé est engendré soit à l'aide d'un codeur convolutif de taux 3/4 ayant 
un treillis à 64 états [WEI 1987,p.494], soit par un codeur en treillis à 16 états [p.ex, UNG 
1987 p.21]. On rappelle que le codeur travaille à la cadence de 685,71 Hz, soit le quart du 
rythme de la modulation. Le décodage pondéré est fait par l'algorithme de Viterbi. Le 
gain asymptotique atteint par rapport à la MAQ 128 est de 5,41 dB (5,27 dB selon [FOR 
1988,Tableau 7,p.1144]) alors que le gain effectif est de 4,63 dB (4,49 dB). Le premier 
MODEM produit chez CODEX utilisait le code MCT de Wei, à huit dimensions et 64 états 
[PAH&HOL 1988,p.23], alors que d'autres modems récemment apparus ont adopté un 
treillis à 16 états [TAN et al. 1987, BAU&MIT 1989]. 


Récemment, un MODEM à 19 200 bits/s est apparu chez MOTOROLA oii un codage 
à 24 dimensions est réalisé par le réseau de Leech [LAN&LON 1989]. Des blocs successifs 
de 96 bits de données sont codés en des points de l'espace de signaux (1 bloc étant 
représenté par un 1 point à 24 dimensions). Les symboles associés à un point à 24 
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dimensions appartiennent à un répertoire de 1 024 - 210 points pour 2 dimensions. Le 
nombre total des signaux possible dans l'espace euclidien à 24 dimension est donc 
(210)12 = 2120 dont seulement 296 appartiennent au réseau de Leech. Le débit 
d'information est donc de 96 bits / 24 dimensions = 8 bits/2D ou 8 bits/T. Lc rythme 
étant 2 400 bauds, un symbole МАО à deux dimensions est émis toutes les T =1/2400 
secondes et un signal à 24 dimensions (point du réseau de Leech) toutes les TA = N/2 T = 
12 1/2400 - 1/200 seconde. Pour donner une idée de la complexité inhérente à un 
nombre de dimensions aussi élevé, il faudrait plus de 1019 années pour transmettre la liste 
exhaustive des mots du code, correspondant à chaque point du réseau, sans répétition ! 


On constate cependant que l'utilisation d'une bande d'à peine 2 400 Hz exige une 
efficacité spectrale de 8 (bits/s)/Hz pour atteindre le débit proposé. Pour ce type de 
codage, étant donné que le facteur d'expansion de l'alphabet est de 4, il faudrait employer 
une constellation MAQ à 1024 états! Dans les MODEMs à 19,2 kbps actuellement 
disponibles, on adopte plutót une bande de 2 742,86 Hz pour le canal téléphonique. La 
constellation bidimensionnelle constituante MAQ, nécessaire pour construire le réseau de 
Leech, doit tout méme avoir 512 points. Ce qui précéde semble indiquer que des 
MODEMS basés sur le réseau de Leech A24 sont beaucoup moins attrayants pour les 
canaux réels que ceux construits selon une MCT multidimensionnelle, vu leur besoin 
accru d'expansion de l'alphabet (voir III.2.4.). 


Les tableaux suivants présentent un арегси des principales améliorations et 
développements des modems sur le canal téléphonique, d'abord sans codage, puis en 
utilisant plusieurs techniques de modulation codée déjà décrites. 
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TABLEAU III. EVOLUTION DES MODEMs SUR CANAL TELEPHONIQUE. 


partie І. MODULATION NUMERIQUE SANS CODAGE. 


> passante | numérique 


m — wm 
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TABLEAU ГУ. EVOLUTION DES MODEMs SUR CANAL TELEPHONIQUE. 


partie II. MODEMs A HAUT DEBIT AVEC CODAGE MODULATION. 


pectrale | passante | numérique 
4 bits/s/Hz | 2400 9600 bps AT&T 
1984 
MAQ 128 | 6 bits/s/Hz | 2400 Hz | 14400 bps divers MCT à 8 états 
1984 
i 2400 
2800 




















di a = ni 
1986 


Hz 
Hz 
=== 
O-MAQ | 7 bits/s/Hz Hz | 19200 bps NEC Multiporteuse 
(200 Hz) 

em 


14 sous-canaux 
1985 


MCT 8-dimension 


MAQ 160 | 7 bits/s/Hz | 2743,86 | 19200 bps 
(à 64 états) 1987 
МАО 512 | 7 bits/s/Hz | 2743,86 | 19200 bps | MOTOROLA Réseau A24 
"Hz 
1988 
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11.4. DELA POSSIBILITE DE TROUVER DES BONS CODES. 


“In brief, this would result from the many symmetries of 
the MDS codes, which mimic the average regularity of 
randomness" б. BATTAIL. 


Оп вай qu'un code aléatoire long est un trés bon code dans le sens que la 
probabilité d'erreur devient trés petite au fur et à mesure que sa taille augmente. Ainsi 
l'écart entre la distribution de poids (ou de distance) du code aléatoire et d'un code donné 
semble bien étre un critére raisonnable pour évaluer combien bon est un code [BAT 1989a, 
BAT 1989]. 


Etant donné un code en bloc linéaire (n,k,d), on considére sa distribution de poids 
de Hamming comme un vecteur de probabilités g = (a0 ,a1,a2, ..., ап) défini par aj 
= Aj /2k où Aj est le nombre de mots du code de poids j. Bien entendu, а; = 0, j«d et ag 

n 


=(,etencore У а; = 1. 
jo? 


D'aprés les résultats de Sidel'nikov [MacW&SLO 1977], la distribution de poids de 
Hamming d'un code binaire quelconque est telle que: 


THEOREME (Sidel'nikov): Soit C un code binaire (n,k,d) ayant comme code dual C4 de 
distance de Hamming d’ 2 3. Alors | A(z) -$ (21s20/Nd^ , 


n 
où A(z)= Уа; (Leto sont la moyenne et l'écart type de la distribution), 
jSp-oz 


2 
et %а)-(2лу12 | exp(-12/2) de = 1 - Q(). 

Ainsi, malgré leur distance minimale médiocre, la performance de quelques codes 
linéaires longs doit être assez proche de celle du code aléatoire. La difficulté consiste à 
trouver un décodeur souple dont la complexité soit raisonnable. Il conviendrait de 
remarquer que Cheung propose une relation explicite entre le caractère aléatoire d'un code 
q-aire et la distance minimale du code dual [CHE 1990]. Ainsi, qu'il s'agisse de codes 
binaires ou de codes q-aires ayant de fortes structures algébriques et de riches propriétés 
combinatoires, il est possible qu'il se comportent (en un certain sens) comme un code 
aléatoire, qui pourtant ne posséde aucune structure. 
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La remise en question de la validité du critère de distance minimale revendiquée 
par Battail [BAT 1989] peut être généralisée à la modulation codée. Dans ce cadre, Battail 
et collaborateurs ont montré que la combinaison d'un code g-aire de Reed-Solomon RS 
(n,k) et d'une application des symboles de son alphabet sur une constellation planc 
symétrique de q points (par symétrique, il faut entendre que l'ensemble des distances 
entre l'un de ses points et tous les autres est indépendant du point considéré) a pour 
résultat une distribution des distances euclidiennes trés voisine de celle que l'on obtient en 
moyenne par codage aléatoire, pourvu que q, n et k soient assez grands [BAT ef al. 1990]. 
Plus tard, en utilisant l'approche du polynóme descripteur d'un code, Battail a été fondé à 
affirmer que le codage MDS constitue une moyen certain d'imiter le codage aléatoire [BAT 
1991a]. 


On insiste sur le fait que la plupart des code longs sont bons dans le sens qu'ils 
sont “proches” du code aléatoire et ont de ce fait une bonne performance. D'autre part, il 
y a trés peu de codes ayant une forte structure mathématique qui sont bons au sens 
classique д/п > € > 0 [COF&GOO 1990]. Cela explique bien la constatation désabusée “АП 
codes are good except those we can think of - folk theorem". La démonstration de 
Shannon que la quasi totalité des codes longs sont bons ne fait pas intervenir le rapport 
d/n [SHAN 1949]. 


Il ne faut donc pas chercher de bons codes au sens classique car on butera 
sûrement sur la barrière “except those we can think of”, très difficile à franchir. Pour 
l'ingénieur, les performances finales et la difficulté de mise en ceuvre du décodeur sont 
les points décisifs du codage. Ces deux objectifs ne sont peut-étre pas aussi antagonistes, 
voire incompatibles, qu'on l'a cru. Battail propose une direction pour sortir de cette 
impasse [BAT 1990b, BAT 1991a] en cherchant des codes fortement structurés qui imitent le 
codage aléatoire (il y en a probablement beaucoup - en tout cas, plus que les codes bons 
au sens classique). Ce processus comprend deux étapes: d'abord, une remise en question 
de la validité du critère de distance minimale. En effet, pour un code ayant un très grand 
nombre de mots, la performance n'est pas principalement déterminée par cette distance si 
le nombre des mots du code à la distance minimale d'un mot donné est négligeable. 
Ensuite, par la constatation que des codes bien structurés - donc probablement à "faible" 
distance minimale - peuvent imiter le codage aléatoire [BAT 89c, BAT et al. 1990, CHE 1989, 
CHE 1990]. La riche structure de ces codes peut conduire à des algorithmes de décodage 
(optimal ou sous-optimal) relativement simples, c'est-à-dire d'une complexité non 
prohibitive pour des longueurs importantes. Le nœud gordien pourra enfin être tranché!. 
Ces idées (bien que n'étant pas encore complétement divulguées ni acceptées dans une 
partie de la communauté scientifique) me semblent ouvrir de nouveaux horizons sur 
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l'avenir du codage. Néanmoins, le besoin de travailler avec des codes longs ne se fera 
sentir qu'à mesure qu'il existera une demande pour des débits au-delà du débit critique, 
ce que l'état de l'art actuel ne permet pas. Dans cette région difficile oà le codage est 
impératif, les moyens traditionnels se sont avérés plutót infructueux. L'avenir du codage 
de canal se jouerait-il à TELECOM PARIS ?. Cette thése vient en quelque sorte appuyer et 
corroborer les idées ci-dessus. 
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L2. APERÇU SUR LES CODES D’UNGERBOECK. 


Les travaux d'Ungerboeck ont permis de "combiner modulation et codage" 
d'une facon logique, éclairante et nette. Le gain apporté par un tel procédé peut atteindre 3 
à 6 dB en rapport porteuse à bruit en gardant la méme bande. 


La règle de décision d'un récepteur optimal (au sens de minimiser la probabilité 
d'erreur) sur un canal à bruit blanc gaussien additif consiste tout simplement à choisir, 
parmi l'ensemble de toutes les séquences de signaux permises, celle qui est la plus proche 
de la séquence reçue (bruitée) au sens de la distance euclidienne [VIT&OMU 1982]. 


Or, les erreurs les plus fréquentes correspondent, au moins pour les codes courts, 
à une décision erronée prise entre des séquences du code qui sont les plus proches. 
Autrement dit, une séquence émise étant donnée, il est plus probable que le bruit la 
change en l'une des séquences codées les plus proches qu'en une autre séquence ayant 
une distance euclidienne supérieure. Cette distance minimale s'exprime, dans un espace à 
nombre de dimensions infini engendré par un code convolutif, par: 


Ф = MIN d ((4p),(bp) ) = MIN Y lan-bnl?, (an) fone C 


min, libre | 
{an }#{d,) 


où {an} {bn} sont des séquences de longueur infinie appartenant au code. 


Ungerboeck s’est donc proposé de maximiser cette distance minimale par un 
choix judicieux de l’espace de séquences permises (code). Le codage se fait par 
l'introduction d'interdépendance entre des séquences de symboles de la constellation 
constituante dans un espace à nombre de dimensions infini. Son idée consiste à 
augmenter la taille de la constellation non codée pour permettre d'ajouter la redondance et 
ensuite d'utiliser une partition en sous-ensembles du jeu de signaux élargi. Par exemple, 
pour une modulation MDP 4 поп codée (2 bits/symbole), on considére une modulation 
MDP 8 codée, ayant donc 3 bits/symbole, dont 2 bits d'information et un troisième de 
redondance. Ainsi, le débit d'information est inchangé, de même que la bande passante 


requise. 
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Les sous-ensembles sont choisis de manière à augmenter la distance minimale à 
sure que l'on progresse dans la partition. On a ainsi, par exemple, l'arborescence 


scvante; 





G © © a 
QOOOQOOOQ 


Figure 4. Illustration de la technique de partition d'Ungerboeck. Partition d'une 
constellation MDP 8. 


On peut partager les huit signaux du niveau А en deux groupes de quatre 
éléments, notés В0 et B1 (plus généralement, la moitié des signaux dans chaque 
groupe). Ils correspondent aux constellations de deux modulations MDP 4 décalées l'une 
par rapport à l'autre. La distance minimale (euclidienne) que l'on obtient entre les signaux 
à l'intérieur d'un méme groupe В (soit В0 ou B1) est 


= dg(B) = VE sin 1/4 = N2 VE. 


Chaque groupe au niveau B de la partition peut à son tour étre divisé en deux 
sous-groupes de deux signaux (encore la moitié des éléments), ce qui constitue le niveau 
C de la partition. La distance minimale (euclidienne) entre deux signaux quelconques à 
l'intérieur de chaque sous-groupe de C est donné par 


Аз = dg(C) = 2 VE. 
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En résumé, la distance minimale entre deux signaux à l’intérieur d'un même sous- 
ensemble à plusieurs niveaux de la partition (ici А,В et C) est donnée par: 


Ap = dg(A) = 2 NE sin 1/8 = 0,765 NE, 
A, = dg(B) = VE sinr/4= N2E et 


Ay = dg(C) = 2 NE. 


L'application bits/symbole MDP est déterminée par un triplet (yo, y1, y2) tel que la 
première coordonnée spécifie le sous-ensemble B, la deuxième coordonnée détermine le 
sous-ensemble C à l’intérieur du sous-ensemble B préalablement sélectionné, et 
finalement la troisième coordonnée choisit un point de la constellation (symbole 
constituant à émettre) dans le sous-ensemble C déjà fixé par les coordonnées précédentes. 


L'évolution du signal au cours du temps peut être représentée par un chemin dans 
un treillis, comme pour toute machine séquentielle. Dans son projet de codes en treillis, 
Ungerboeck impose quelques règles générales de symétrie (la symétrie apparaît encore 
comme un caractère essentiel des bons jeux de signaux): 


primo- Tous les signaux apparaissent un méme nombre de fois, avec symétrie (une 
méme probabilité est attribuée à tous les signaux). 


secondo- Les transitions dites parallèles sont associées à des signaux ayant entre eux une 
distance maximale (dans l'exemple, des signaux appartenant au méme sous-ensemble C). 


tertio- Les transitions associées aux branches arrivant à un méme nœud du treillis, ou en 
partant, doivent correspondre à des signaux du méme sous-ensemble (dans l'exemple, 
appartenant à un méme sous-ensemble B). 


Pour émettre т bits/symbole avec une modulation à deux dimensions, c'est-à-dire 
avec une efficacité spectrale de m (bits/s)/Hz, on utilise une constellation agrandie, à 
2т-1 points, divisée en sous-ensembles (la modulation non codée ayant même débit utile 
n'exige que 2” points). Ungerboeck a montré qu'un doublement de la taille de l'alphabet 
suffit pour atteindre la capacité [UNG 1982]. A présent, cependant, la modulation codée 
multidimensionnelle utilise une expansion moindre, comme on le verra plus en détail dans 
la suite. 
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Les diagrammes de treillis de quelques codes d'Ungerboeck sont représentés dans 
la figure ci-dessous. 


(0,2,4,6) 
(4,6,0,2) 


(1,3,5,7) 
(5,7,1,3) 
(2,0,6,4) 


(6,4,2,0) 


(3,1,7,5) 





5 (7,5,3,1) 


Figure 5. Diagramme de treillis à 2, 4 et 8 états pour les codes d'Ungerboeck MCT/MDP. 


Dans une modulation non codée comme la MDP, le signal émis pendant un 
intervalle de temps n'a pas de rapport avec les signaux précédemment émis ni avec ceux 
qui le seront ensuite. Une modulation de ce genre est dite à états successifs indépendants, 
et toutes les combinaisons de symboles à deux dimensions sont permises. Dans la 
modulation codée, en revanche, le signál émis pendant un intervalle (associé aux éléments 
binaires émis pendant cet intervalle) dépend non seulement des éléments binaires d'entrée 
de cet intervalle, mais aussi du passé, c'est-à-dire de l'état du système. Ainsi, toutes les 
combinaisons de signaux ne sont pas permises et la régle selon laquelle on admet une 
séquence définit le code. On voit aisément que ce processus introduit de la redondance 
tout comme le codage classique. Par exemple, pour le code en treillis à deux états (fig. 
5а), on voit que la séquence 50,56,51,52,57,57»... est une séquence du code alors que 
50,51,81,52,57,56.... n'en est pas une. 
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Ici, on ne présente que des réalisations du codeur sous forme systématique avec 
rétroaction (fig 6) pour les treillis décrits dans la figure 5. 





Figure 6. Codeurs d'Ungerboeck MCT/MDP 8 sous forme systématique avec rétroaction 
avec un treillis à 2,4 et 8 états, respectivement. 


Les gains asymptotiques apportés par le codage, c'est-à-dire à des rapport signal à 
bruit trés élevés, sont calculés en décibels par: 


ЕТЕ 


с é = 10 log, 
ai cod М codé Es, non codé 


oü die et E, sont, respectivement, le carré de la distance euclidienne libre et l’énergie 


moyenne des signaux dans la constellation, affectés des indices “codé” et "non codé” 
pour identifier le système leur correspondant. 


Ce gain est fréquemment interprété de la façon suivante: 


Gcodé/non codé = С - L, 
où С = 10 logig [f ibre codé / d’ ibre non codé] 65116 gain en distance apporté par le 
codage et L = 10 logio [E, coge! Es. non coge) ES! la perte due à l'agrandissement de la 
constellation. 


Le décodage à décision pondérée est effectué par l'algorithme de Viterbi avec un 
retard de décision de M = 6 v en prenant le carré de la distance minimale comme 


métrique. 
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Afin de donner une idée des gains et les complexités que l'on obtient en utilisant 
cette méthode, le tableau V présente les résultats de divers schémas MCT [UNG 1987]. 


TABLEAU V. 


GAIN ET NOMBRE D'ETATS DU TREILLIS DE QUELQUES SCHEMAS DE 
MODULATION CODEE A DEUX DIMENSIONS. 


d'états |/MDP4|/MDP8 |/MDP8 |/МАО 16 | /MAQ 32 
Cu [so | ase | ass | so | 2m | 
e зво cor | sas | sos | 77 | 
ie | as | ase | вао | ar | ase 
pet Pe pem pe pend 
os [ssl ssi | rar | 6o | su | 
















Plus généralement, pour un systéme codé ayant une efficacité spectrale de m 
(bits/s)/Hz, on utilise une modulation à 27%1 points combinée avec un codeur convolutif 
de taux R 2 n / (Mm +1), ой M & m dépend du nombre de niveaux de la partition que l'on 
considère. Les points de la constellation agrandie sont divisés en 27-1 sous-ensembles, 
ayant chacun 27 points: 


2741 sous-ensembles . 27-7 points / sous-ensemble = 2?*! points. 
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Les meilleurs codes convolutifs de longueur de contrainte assez petite sont 
normalement construits en maximisant l'accroissement de distance de Hamming aux 
extrémités de l'événement d'erreur [CLA&CAI 19BB]. Autrement dit, la première et la 
dernière branches y contribuent majoritairement à la valeur totale de la distance entre un 
chemin correct et un chemin erroné. 


Ungerboeck a cherché des schémas de MCT avec un accroissement important de la 
distance euclidienne entre les branches qui divergent puis convergent dans un évenement 
d'erreur. D'une Ғасоп similaire, il a trouvé que les meilleurs codes en treillis sont obtenus 
en y maximisant le “poids” de la première et de la dernière branche. 


Cependant, bien que ce comportement soit observé pour les codes à mémoire 
courte, il ne semble pas que le projet de codes en treillis MCT à longueur de contrainte 
élevée doive être guidé par le même critère. En cherchant à analyser les codes en treillis à 
trés grand nombre d'états, il serait utile d'examiner la distribution des événements 
d'erreur (spectre de distances). 


Il s’avère que la structure des événements d'erreur des codes longs n'est pas la 
méme que celle des codes courts. Plus spécifiquement, la contribution à la distance libre 
minimale que l’on obtient aux extrémités d'un événement d'erreur peut ne pas être 
significative par rapport à la distance totale dans un événement d'erreur. Le projet de 
codes longs n'est pas une question complétement réglée (les 6 dB de gain obtenus par les 
codes en treillis correspondent à peu prés au débit critique [FOR et al. 1984]). Cela ne sera 
probablement nécessaire qu'à des débits trés élevés, dépassant méme le débit critique du 
canal. Encore faudra-t-il changer le critére utilisé dans la construction des codes pour y 
réussir. Il semble que la distribution de distance va jouer un róle prépondérant par rapport 
à la distance minimale. Là, encore, on rejoint les idées de Battail à propos de la 
construction explicite de bons codes longs. 
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L3 ETAT DE L'ART. 


13.1 GAIN POTENTIEL DE LA MODULATION CODEE. 


La probabilité d'erreur par symbole dans une modulation MAQ non codée est 
bornée conformément à [PRO 1989]: 


Pe (M) $1 - (1 -erfe (VE 112, 


où QU) = 3 erfc(x/2) ou егісо) = 200025). 


Alors, pour des rapports signal à bruit assez élevés (үзу 22M), on a l'approximation 


Pe (M) = 2 ee CN llt. 


Tout d’abord, on remarque que l'agrandissement du jeu de signaux de façon à 
augmenter le débit d'un bit par symbole à deux dimension (1bit/symbole 2D) exige de 
doubler la taille de la constellation de départ, soit М” = 2k*! au lieu de M = 2k. La 
probabilité d'erreur que l'on en tire est 


= 
Р”, (M’) = 2 erfc лез ). 


Ainsi, pour assurer le même taux d’erreur, la perte en puissance due à l’expansion 
de l'alphabet est d'environ 3 dB toutes les fois que l'on double la taille de la constellation. 
En effet, puisque P’e (M”) = Pe (M), il s'ensuit que Y ay = 2Yav. 


suivante: 


En cherchant à évaluer les gains potentiels de la modulation codée, on fixe 
d'abord un niveau souhaitable pour le taux d'erreur (disons 10-5), et l'on examine ensuite 
quel rapport signal à bruit est nécessaire pour garantir ce taux. 


Pour une modulation non codée il vaut, d’après les approximations ci-dessus, 


2[erfc-1(0, 5у]2 
үу” [erfc 0210. )] (M-1). 
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Plus généralement, le rapport signal à bruit dont on a besoin pour maintenir le taux 
d'erreur inférieur à € est donc 


(M-1). 


av 


2Гегіс: (0,5 ғ)]2 
-= 


D'autre part, le rapport signal à bruit minimal pour atteindre ce taux d'erreur est, 
selon la formule de la capacité, Yay = (M-1), M = 278 étant le nombre de points par deux 
dimensions. Forney et al. remarquent que le gain potentiel de la modulation codée, pour 
des taux d'erreur entre 10-5 et 106, est de 8 (9 dB) [FOR et al. 1984]. 


Or, cette valeur a été mentionnée par Oliver, Pierce et Shannon il y a bien 
longtemps [OLI ег al. 1949,p.1327], remarquant que la MIC exige à peu prés une 
puissance supérieure d'un facteur 8 (9 dB) à la limite théorique établie par la capacité! 


TABLEAU VI. GAIN POTENTIEL APPORTE PAR LA MODULATION CODEE. 


d'erreur£| (поп codée) Yay à Pe =€ 
os | soson | sa 
FE 


-11,40(M-1) 10,57 
12,90(M-1) 11,11 


10:10 14,40(М-1 11,58 


Ln | usen. | eo 
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Gain potentiel de la modulation codée 


gain du codage-modulation 


4X gain 
æ gain dB 





Figure 7. Gain potentiel du codage à divers niveaux de probabilité d'erreur. 


On voit aisément que, bien que le gain de codage soit limité pour les taux d'erreur 
utilisés en pratique, le meilleur gain asymptotique, paramétre trés employé pour la 
conception des codes, est en fait illimité. 


La capacité d'un canal à bruit additif, blanc et gaussien peut &tre scindée en deux 
parties, l'une fonction seulement du rapport signal à bruit et l'autre ne dépendant que de 
la bande passante. Le codage n'est en fait lié qu'à la première partie [WOZ&JAC 1967, GAL 
1968]: См = 1/2 log2(1 + S/N) bits/dim. D'autre part, la limitation de bande impose aussi 
une limitation du débit [WYN 65, JER 77] exprimée par Cg = 2B dim/s. La capacité du 
canal gaussien est donc donnée par C = Св Cy = B log(1 + S/N) bits/s. 


Pour aborder le codage, il semble raisonnable d'exprimer la capacité normalisée à 
deux dimensions: См“ = log2(1 + S/N) bits / symbole 2D ou (bits/s)/Hz. D'ailleurs, on 
interprète assez souvent la limitation de débit due à la bande comme étant Св“ = B 
symboles 2D/s - B bauds (la capacité peut aussi bien étre exprimée en (bits/s)/bauds). 


Il y a deux points importants qui doivent étre éclaircis. D'abord, les techniques de 
modulation codée ne conviennent pas qu'aux canaux à bande étroite, mais toutes les fois 
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que le canal appartient à la région limitée en bande. Ainsi, elles peuvent étre fort utiles 
pour des canaux typiquement à bande large tels que les canaux de satellite. En effet, 
méme si un accroissement de la puissance disponible dans les répéteurs a été réalisé, les 
exigences de débit ont augmenté encore bien plus vite, de sorte que la limitation de bande 
s'y fait sentir. Ensuite, on doit prendre garde à la proximité entre le taux d'émission déjà 
atteint dans la pratique et la capacité. Les systèmes pratiques mis en œuvre jusqu'ici n'ont 
pas encore atteint des débits aussi proches de la capacité que l'on aurait pu le penser (voir 
l'exemple 10.3.1 dans le récent ouvrage “Elements of Info. Theory“, p.250, T. COVER et 
J. THOMAS, Wiley,1991). La comparaison doit toujours étre faite en tenant compte de la 
bande de fréquences utilisée. Par exemple, la valeur de 19 200 bits/s ne correspond au 
débit critique du canal téléphonique que si la largeur de bande utilisée est de 2 400 Hz. La 
limite ultime (le débit critique) proposée en [FOR et al. 1984] s'écrit plus clairement 
comme une efficacité spectrale de 8 (bits/s)/Hz. Si l'on utilise une bande plus large 
(comme dans les MODEM d'aujourd'hui — 2 743,86 Hz), un débit de 19 200 bits/s est 
équivalent à une efficacité spectrale de 7 (bits/s)/Hz: il ne correspond pas exactement au 
débit critique du canal. Cependant, cette réussite représente sans l'ombre d'un doute un 
formidable développement des débits numériques. Dans les années soixante-dix, 
personne ne croyait qu'il serait possible de parvenir à tels débits sur les voies 
téléphoniques [HOL 1977]. Pour éviter les difficultés dans l'évaluation de la proximité du 
débit et de la capacité pour différentes largeurs de bande, il convient de l'exprimer en 
fonction de l'efficacité spectrale, comme on le montre dans la figure suivante. 
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10 
8 
2 
3 6 
= 
2 
e 4 4 C bits/s/Hz 
-€- RO bits/s/Hz 
“- uncoded 1e-5 
2 
0 snr dB 
0 10 20 30 
Efficacité spectrale 
Figure 8. Capacité et débit critique exprimés en termes de limitation de l'efficacité 
spectrale. 


La transmission de données sans interférence entre symboles est possible méme 
dans des canaux idéalement limités en bande utilisant des filtres de Nyquist, pourvu que 
le débit de Nyquist ne soit pas dépassé [BIC et al. 1986, PRO 1989, etc]. 


La largeur de bande impose donc une borne supérieure au débit et cette limitation 
ne découle pas de la théorie de l'information. 


Bien que l'on en déduise la limite 2B dim/s, il faut mentionner quelques autres 
(étonnants) résultats récents. Ils montrent qu'il est possible d'émettre à un débit 25% plus 
grand que le débit de Nyquist sans réduire la distance minimale, malgré la présence 
d'interférence entre symboles [MAZ 1975, MAZ&LAN 1988, HAJ 1990]. Ces résultats 
concernent exclusivement des problèmes liés à la limitation de bande et n'ont aucun lien 
avec le rapport signal à bruit. Quoique ces résultats n'aient pas d'incidence sur le codage 
(ni la capacité par dimension de Shannon), il peuvent s'avérer profitables pour améliorer 
le débit d'information au-delà de la capacité en bits/s (pas en bits/dimension!). C'est 
certainement une voie de recherche qui doit étre envisagée dans l'avenir. 
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L3.2 MODULATION CODEE EN TREILLIS (MCT). 


L'utilisation du codage correcteur d'erreur direct (FEC) est maintenant trés 
répandue et largement acceptée pour augmenter l'efficacité de la transmission dans 
virtuellement dans tous les canaux de communication numérique. La situation est un peu 
plus compliquée dans la MCT car l'application non linéaire bit/symbole rend le codeur 
partiellement non linéaire quoique le code convolutif employé soit linéaire. 


Thapar a examiné les performances des codes d'Ungerboeck dans un canal 
gaussien en présence de diverses distorsions y compris les distorsions linéaires, non 
linéaires, gigues de phase, écart de fréquence et bruit additif [THA 1984]. Il a montré une 
fois pour toutes, au moyen d'une mise en ceuvre pratique sur un processeur de signaux 
numérique à 12 bits, que les codes d'Ungerboeck sont trés robustes et peuvent réaliser 
une grande amélioration des performances méme en présence de distorsions sévères. 


En 1986, Wilson et d'autres ont présenté la conception et le projet d'un codage 
hybride entre modulation codée et codage classique dans le sens que le codage apporte un 
élargissement partiel de bande [WIL et al. 1986]. Ils ont conçu un codage en treillis basé 
sur un code convolutif de taux 5/6 à 8 états dont le gain sur un canal à bruit additif 
gaussien est de 6 dB par rapport au systéme MDP 8 au prix d'une augmentation de 16% 
de la bande. 


D'autres aspects théoriques assez intéressants sur le codage-modulation ont été 
abordés par Benedetto, Marsan et collaborateurs [MARet al. 1984, voir aussi BEN et al. 
1988]. Des codes linéaires appartenant à une classe particuliére nommée codes 
superlinéaires ont été introduits. Leur propriétés permettent d'épargner largement le temps 
de calcul lors de l'analyse des performances. Une recherche de codes MCT sur les MDP 
16 et MDP 32 dont la complexité va de 4 à 128 états a été réalisée et a abouti à de 
nouveaux codes. 


Wilson et collaborateurs ont étudié un système de modulation codée pour le canal 
de satellite ayant une efficacité spectrale de 3 (bits/s)/Hz [WIL et al. 1984]. Le codage de 
canal consiste en la combinaison d'un code convolutif à 32 états avec la modulation MDP 
16; le gain apporté est d'environ 4,8 dB. La performance de ce systéme est évaluée sur 
un canal non linéaire fortement limité en bande. Bien que la performance du système codé 
soit dégradée par rapport au système non codé, on montre que le gain du codage est 
grosso modo préservé. 
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Benedetto et а! examinent le projet de paramétres critiques du récepteur pour un 
svstéme de codage-modulation MCT / 16 MDP dans l'intention de limiter la complexité au 
minimum possible en vue d'une construction en VLSI. Le retard de décodage de 
l'algorithme de Viterbi, l'effet de la quantification des métriques et la présence de gigue 
de phase dans la porteuse récupérée ont été évalués par simulation [BEN er al. 1989]. 


Viterbi, Wolf et collaborateurs proposent un trés intéressant schéma pour 
l'implémentation commerciale des codes en treillis [VIT er al. 1989]. Le principal avantage 
de cette approche est de permettre la mise еп œuvre d'une grande variété de codes МСТ 
quasi-optimaux à l'aide d'un simple et unique codeur-décodeur de taux 1/2, tout 
simplement en opérant des changements mineurs de connexion pour introduire des 
branches parallèles. П ont obtenu ainsi des gains allant de 3 dB à environ 6 dB, en 
fonction du codeur sélectionné. 


Le décodage souple des codes MCT peut étre fait soit au moyen de l'algorithme de 
Viterbi (optimal) [VIT&OMU 1982], soit par un algorithme séquentiel (versions de Fano- 
Wozencraft ou aidé par un génie, etc) [AND&MOH 1984], voir aussi [POT&TAY 1989]. 


L'application de la modulation codée aux transmissions par satellite, plus 
spécifiquement des codes МСТ sur la modulation MDP, a été réexaminée de façon 
remarquable par Hagenauer [HAG 1989]. Cela englobe d'une part la M-MDP codée 
employée dans le système INTELSAT et d'autre part celle qui est appliquée aux services 
mobiles du système M-SAT. Des canaux INTELSAT à 64 kbits/s pour la transmission de 
voix et de données utilisent un code d'Ungerboeck à 4 états sur la MDP 8 tandis que des 
canaux à 120 Mbits/s (140 Mbits/s) possèdent actuellement un modem 8 MDP codée en 
MCT à 16 états. Il est à remarquer que la synchronisation et la récupération de phase de la 
porteuse consomment prés de la moitié de la puissance des processeurs. 


Il est connu que, pour des rapports signal à bruit modérés, les performances des 
codes peuvent étre prédites à partir du spectre des distances et pas simplement de la 
distance minimale (méme compte tenu du nombre des mots à cette distance). Rouanne a 
présenté un algorithme tiré de l'algorithme bidirectionnel à pile destiné à l'évaluation du 
spectre de distance euclidienne des codes MCT [ROU 1989]. 


Des gains assez modestes par rapport à la МСТ classique peuvent être obtenus en 
introduisant une modulation asymétrique [DIV et al. 1987]. Cependant, la complexité qui 
en résulte ne justifie guére l'emploi de cette méthode. 
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Pottie et Taylor ont montré, en faisant appel au concept de poids euclidien 
d'Ungerboeck, comment déterminer exactement la distance minimale libre des codes MCT 
sur des modulations МАО carrées cn пе prenant en considération quc les distances des 
chemins par rapport au chemin tout zéro [POT&TAY 1987]. 


Rouanne définit la classe des codes quasi-réguliers [ROU 1988, ROU 1990] comme 
l'ensemble des codes MCT dont le spectre de distance euclidienne peut étre calculé à partir 
du nombre de chemins (mots de code) par rapport au chemin nul du treillis. 


L'application de la modulation codée n'est pas restreinte aux modulations 
traditionnelles MDP/MAQ. Padovani et Wolf ont considéré le projet de MCT utilisant la 
technique de partition d'Ungerboeck avec une modulation numérique combinée en 
fréquence et en phase [PAD&WOL 1986]. Cette aproche a l'avantage de limiter le nombre 
d'états de la constellation constituante. Par exemple, il est possible de concevoir une 
modulation 4-MDF / 8-MDP codée pour obtenir des gains de codage importants avec une 
efficacité spectrale de 4 (bits/s)/Hz (4 bits/T). On considère aussi le codage en treillis МСТ 
appliqué à une modulation combinée 4-MDF/16-MAQ ayant une efficacité de 5 (bits/s)/Hz. 
Les caractéristiques spectrales de tels schémas sont évaluées et l'on montre qu'ils sont 
bien adaptés aux canaux fortement limités en bande passante. 


Une borne inférieure de la meilleure distance minimale (libre) euclidienne des 
codes MCT a été développée par Rouanne [ROU 1987, ROU 1990]. Cette borne est déduite 
du codage aléatoire appliqué à l'ensemble des codes en treillis non linéaires. Il démontre 
que la distance libre augmente linéairement avec la longueur de contrainte pour des 
valeurs élevées de cette dernière. Etant une borne inférieure, elle garantit l'existence de 
bons codes MCT. 


Calderbank et autres ont étudié les bornes de la distance euclidienne minimale qui 
peut étre atteinte avec la modulation en treillis. Etant donné le nombre v de registres de 
mémoire, la distance minimale normalisée d'un code un treillis quelconque (v,k) ayant 
ses valeurs sur l’espace euclidien Кп obéit à la borne suivante [CAL et al. 1985): 


3.285v x 4 
f "MERC si k/n 2 1n"*4 
dua. 4 
Р(С) 
SUM si Кп < 10714, 





kin 
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ой P(C) est la puissance normalisée à deux dimensions. 


L'évaluation des performances d'une certain classe de МСТ est abordée par Wolf 
et Zehavi en exhibant une méthode de calcul de la distribution de poids des erreurs 
utilisant la fonction génératrice [ZEH&WOL 1988]. 


Honig suggère une technique pour réduire le temps de recherche (par ordinateur) 
de codes en treillis MCT de longueur de contrainte élevée en utilisant des connections de 
treillis en parallèle [HON 1988]. 


Divsalar et Simon ont, de leur cóté, inventé unc nouvelle technique plus générale 
que la МСТ, appelée Modulation Multiple Codée en Treillis (MMCT) où, contrairement 
aux systémes MCT conventionnels, plusieurs symboles du canal sont attribués à chaque 
branche du treillis [DIV&SIM 1987, DIV&SIM 1988a]. Cette idée permet de parvenir trés 
aisément à des efficacités spectrales fractionnaires. De plus, elle apparait comme un outil 
intéressant dans le cas des canaux à évanouissement [DIV&SIM 1988c]. 


D’ ;culiers du projet de MCT: 


Bien des travaux ont été déjà consacrés au probléme de l'emploi de la MCT en 
présence d'évanouissement . Un des plus sérieux inconvénients à cette application est lié 
au besoin d'une détection cohérente pour atteindre leur gain potentiel. 


Makrakis et Feher proposent un algorithme séquentiel pour la détection 
différentielle de systémes de MCT sur une modulation MDP [MAK&FEH 1988]. Le 
probléme de la détection différentielle des codes MCT a été abordé pour la premiére fois 
par Simon et Divsalar [SIM&DIV 1987], puis largement considéré par Edbauer [EDB 1987, 
EDB 1989a, EDB 19895). П a évalué les performances d'un codage-modulation avec 
entrelacement sur une modulation MDP différentielle (8-DPSK) dans un canal à 
évanouissement de Rayleigh ou de Rice. McLane et collaborateurs ont étudié l'application 
et les performances de la MCT pour la transmission de la voix sur un canal mobile par 
satellite en considérant la MDP et la MDP différentielle codée en treillis [McL et al. 1987, 
McL et al. 1988]. Lee et Farrel ont évalué par simulation les performances de codes en 
treillis MDP/MCT à 4 et 8 états àvec invariance de phase, et dont la longueur de contrainte 
est 3 et 4, sur un canal avec évanouissement de Rayleigh [LEE&FAR 1991]. Au taux 
d'erreur de 10-3, les gains obtenus sur la modulation non codée correspondante sont de 
2,5 , 3,7, 4,0 et 5,1 dB. Moher et Lodge proposent l'utilisation d'une porteuse pilote 
avec les données codées pour permettre la détection cohérente sur un canal de Rice avec 
évanouissement [MOH&LOD 1989]. Cette méthode s'avére trés robuste sur une vaste 
gamme de canaux à évanouissement. 
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Du coté théorique, Divsalar et Simon ont déduit une borne de Chernoff 
(exponentielment fine) sur la probabilité d'erreur des signaux deux à deux pour des codes 
MCT sur un canal gaussien avec évanouissement de Rayleigh [DIV &SIM 1988b]. A partir 
de cette borne, il est possible de proposer un critère pour la construction de codes МСТ 
adaptés aux canaux à évanouissement, cn utilisant encore l'idéc d’une partition des 
ensembles [DIV&SIM 1988c]. Des résultats similaires ont été trouvés par Schlegel et 
Costello [SCH&COS 1989]. Divers nouveaux codes mieux appropriés à ce genre de canaux 
ont été trouvés [SCH&COS 1989, JAM&LE N 1987]. Néanmoins, dans le cas des 
communications de radio mobile, la fonction d'autocorrelation du fading est une fonction 
de Bessel dont la décroissence est lente. Il est alors difficile de réaliser un entrelacement 
parfait pour rendre les échantillons non correlés, à cause de la trés grande durée du retard. 
Le probléme de la conception et des performance de la MCT sur un canal à 
évanouissement de Rayleigh avec mémoire a été généralisé par Leeuwin-Boulé et autres 
[LEEU et al. 1991]. 


En général, on n'a considéré pour cette application que des codes MCT sur une 
modulation MDP, compte tenu de leur propriété d'enveloppe constante. Du et Vucetic 
mentionnent qu'avec l'utilisation d'une porteuse pilote, les modulations codées sur MAQ 
peuvent présenter des avantages sur la MDP codée [DU&VUC 1991]. Ils proposent donc 
des codes MCT sur la modulation MAQ 16 pour le canal à évanouissement de Rayleigh. 
Le développement du codage MCT pour la transmission mobile par satellite est considéré 
dans [YUE et al. 1990]. 


Les performances et le projet de codes MCT sur des canaux non linéaires à 
mémoire finie ont été abordés en utilisant les séries orthogonales de Volterra pour 
modéliser un système non linéaire discret. [LIU et al. 1990]. Des schémas МСТ sur le canal 
de satellite avec des non-linéarités ont été étudiés par Biglieri, et Marsan et collaborateurs 
[BIG 1984,MAR et al. 1987]. Le codage sans élargissement de bande sur la modulation 16- 
MDP pour transmettre 3 (bits/s)/Hz donne un gain de 2 dB au taux d'erreur de 10-6 en 
considérant les effets de la limitation de bande et des non-linéarités. 


Il est parfois utile d'admettre la présence d'une interférence entre symboles 
contrólée en vue de la mise en forme spectrale du signal, par exemple spécifiant la 
position de zéros de la réponse de fréquences [KAB&PAS 1975]. Cela est utile dans le cas 
d'une forte limitation de bande. D'autre part, les modèles de canaux à réponse partielle 
sont aussi trés utiles pour l'enregistrement numérique magnétique. Les besoins du codage 
correcteur d'erreur se sont beaucoup accrus avec l'avènement d'enregistrements à très 
haute densité visant à répondre à la demande toujours croissante dans les domaines du 
stockage de données. Le projet de codes du type MCT adaptés à des canaux à réponse 
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partielle est abordé dans les références [WOL&UNG 1986, ZEH&WOL 1988 et FOR&CAL 
1989]. 


Le projet de codes MCT pour la transmission numérique en présence 
d'interférence entre symboles est aussi considéré dans [EYU&QUR 1989, WON&McL 1988]. 
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1.3.3. MODULATION CODEE EN BLOC (MCB). 


Beaucoup d'intérêt a été porté, dès la dernière décennie, aux codes où la 
redondance n'est pas obtenue en ajoutant des symboles de parité, mais par 
l'intermédiaire d'une augmentation de la taille de l’alphabet. Le travail d’Ungerboeck 
étant fondé sur des codes convolutifs, on a été naturellement conduit à se poser la 
question d'adapter ces techniques aux codes en bloc. 


Un des pionniers de la modulation codée en bloc (MCB) est Cusack qui a introduit 
une application de la technique de partition d'Ungerboeck aux codes de Reed-Muller 
combinés à une modulation MAQ [CUS 1984]. 


Forney, Gallager et collaborateurs ont bien explicité les moyens de réaliser la 
partition des ensembles pour appliquer la modulation codée à des codes en bloc.[FOR er 
al. 1984]. Ils ont présenté la mise en œuvre d'une famille de schémas basés sur des codes 
en bloc connus, pour les dimensions М - 4, 8, 16 et 24, conduisant à des gains 
asymptotiques de 1,5 3,0 4,5 et 6,0 dB, respectivement. Le processus de décodage 
souple (à maximum de vraisemblance) peut être réalisé à l'aide d'un treillis Dans ce 
remarquable article, le rapport étroit existant entre le codage-modulation en bloc et la 
construction de réseaux denses est clairement mis en évidence. C'est principalement cette 
derniére (riche) interprétation du codage-modulation en bloc qui est adoptée dans cette 
thèse. 


Ensuite, Sayegh a généralisé l’approche du codage MCB proposée par Cusack et a 
définitivement établi la puissance des codes en bloc dans le domaine de la modulation 
codée [SAY 1986]. Cette généralisation a consisté à appliquer divers codes binaires connus 
au projet de systèmes de modulation-codage adaptés à plusieurs constellations de signaux 
MDP et МАО. 


On illustre dans ce qui suit l’idée de modulation codée en bloc par des exemples 
très simples du projet conjoint d’un codage en bloc avec une constellation constituante à 2 
dimensions ayant 2” points comme dans la figure ci-dessous. 
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Figure 9. Constellations MDP et MAQ et leurs applications respectives bits/symbole. 


On forme une matrice d'éléments binaires ayant n colonnes et m lignes. Chaque 
colonne correspond à un point de la constellation à 2 dimensions selon l'application 
indiquée. L'ensemble de n points de l'espace à deux dimensions constitue un signal dans 
un espace à 2n dimensions (oà chaque symbole est représenté par un point). Si l'on 
introduit de la redondance dans chaque ligne de la matrice, alors les n symboles à deux 
dimension qui constituent le signal multidimensionnel sont codés, c'est-à-dire que toutes 
les séquences de n symboles bidimensionnels ne sont pas permises. On prend donc 
autant de codes binaires que de lignes de la matrice, soit m codes constituants, tous de 
méme longueur п. Une matrice binaire nxm correspond à un mot de code dans l'espace 
multidimensionnel si et seulement si chaque ligne est un mot du code binaire 
correspondant à cette ligne. Par exemple, pour la modulation MDP 8, on a m = 3. Soit 
(n,ki,dj) le code binaire qui détermine la ligne i, i = 1, 2, 3. Bien entendu, 0 «Xj S n. En 
supposant que l'on impose la contrainte А+ k2+k3 = 3rn, le débit d'information (utile) 
est alors 3r bits par symbole à deux dimension (toujours inférieur à 3 bits/symbole 
puisqu'il y a de la redondance). Pour г fixé, le probléme consiste à choisir les codes (ki, i 
i = 1, 2, 3) de façon à maximiser la distance euclidienne minimale qui en résulte. Cela est 
réalisé en tenant compte des propriétés suivantes de la distance euclidienne: 


. Si deux mot du code différent dans la premiere ligne, alors sürement la distance 
entre eux est A 2 0,765 quelles que soient les lignes suivantes. 


Si deux mot du code coïncident dans la première ligne, alors sûrement la distance 
entre eux est А 2 1,414 quelle que soit la dernière ligne. 


Finalement, si les deux mots de code des deux premières lignes coincident , 
alors A 2 2. 


CHAPITRE I: L'état de l'art 50 


Le carré de la distance euclidienne minimale entre mots de code dans l'espace de 
signal est de ce fait 


min = MIN (0,586 d1,2d2,4d3). 


La modulation codée la plus efficace est déterminée par une recherche exhaustive 
des codes binaires (n,k;,d;) solutions du problème d'optimisation: 


MAX Min (0,586 d1,2d2,4d3), 
(n,kidi) 

contraintes 

O<ki<n, 

k1+ k2+k3 = 3rn. 


à l'aide des tableaux de bornes sur la distance de Hamming minimale pour des codes en 
bloc binaires [p. ex., HEL&STI 1973, VER 1987]. 


En 1988, Isaksson a développé une classes de codes MCB basée sur une 
combinaison de codes cycliques non-idéaux (définis par des matrices circulantes) avec la 
modulation MDP [ISA 1988]. Le décodage souple est effectué par l'algorithme de Viterbi à 
l'aide du treillis [WOL 1978]. Des résultats de simulation ont été présentés pour divers 
codes de taille moyenne; ils montrent que le gain de codage est, à des rapports signal à 
bruit modérés, trés sensible aux nombre des mots du code à la distance minimale [ISA 
1988, ISA 1989]. 


L'évaluation des performances de divers schémas MCB a été analysée par 
Kasahara et Du [KAS&DU 1988]. Huber a examiné un système de modulation codée en 
bloc à synchronisation facile basé sur l'application de codes de Reed-Solomon [HUB 
1989]. 


Chouly et Sari ont récemment développé des familles de MCB basées sur le 
premier et le deuxiéme niveau de la partition dont le gain asymptotique est de 3,0 dB et 
4,5 dB respectivement [CHO&SAR 1990]. Ces schémas, trés attrayants pour des 
applications à haut débit, sont obtenus en combinant des codes en bloc de longueur trés 
courte à la modulation MAQ. Des constellations MAQ à 32, 128 et 512 états ont été 
considérées, permettant d'obtenir des efficacités spectrales de 4, 6 et 8 (bits/s)/Hz. 


Testard a présenté deux codes MCB adaptés à la transmission par faisceaux 
hertziens à trés grand débit [TES 1990]. Dans ce cas, on cherche à combiner la modulation 
MAQ 128 avec des codes simples. L'intérét de cette technique réside dans la simplicité des 
décodeurs. En effet, la complexité du décodeur de Viterbi dans les récepteur MCT limite 
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leur application à des systèmes à débits moyens, inférieurs à 45 Mbits/s. Les résultats 
sont comparés à ceux d'une modulation МАО 64 non codée. Plusieurs procédés de 
décodage connus [FOR er al. 1984, SAY 1986, etc.] sont abordés et le compromis entre 
complexité et gain est évalué. Le méme probléme a été récemment abordé par Karam et 
collaborateurs en considérant le codage en bloc multiniveau [KAR er al. 1991]. Un schéma 
de modulation codée pour la МАО 128 basé sur le deuxième niveau de partition est 
présenté; son gain asymptotique est d'environ 4 dB à 108 et la complexité du décodeur 
assez modérée. 


De son coté, Chang a appliqué la technique de partition d'Ungerboeck au projet 
d'une modulation codée en bloc dans le but d'augmenter l'ordre de diversité de 
l'émission sur un canal à évanouissement de Rayleigh non sélectif [CHA 1988]. Il a 
comparé la performance d'un systéme MDP 8 codée en bloc avec celle d'un systéme de 
radio mobile conventionnel utilisant un code convolutif binaire de taux 2/3 appliqué à une 
modulation MDP 4. On constate qu'une diversité de même ordre est possible sans 
élargissement de la bande. 


L'idée du codage en plusieurs étapes, congue en 1977 par Imai et Hirakawa, 
consiste en une combinaison de plusieurs codes correcteurs d'erreur selon une partition 
de la constellation des signaux en sous-ensembles [IMA&HIR 1977]. Elle est fortement liée 
à la modulation codée. 


Portugheis considére la combinaison de la modulation MDP avec des codes en 
bloc et exhibe une famille de codes linéaires et invariants à la rotation de phase dont le 
décodage peut étre réalisé par un décodeur à plusieurs étages [POR 1991]. 


La construction de MCB adaptées aux canaux à évanouissement de Rayleigh a été 
aussi étudiée. Vucetic et collaborateurs considèrent la modulation MDP-M combinée à des 
codes en bloc sur un anneau modulo M [VUC et al. 1990]. П y est montré que le critère 
pour le projet de tels codes doit tenir compte non seulement de la distance minimale 
euclidienne mais aussi de la longueur éffective des chemins du treillis [aussi ZHA&VUC 
1990]. 


La conception de systèmes efficaces de modulation codée en bloc faisant appel à 
la théorie des codes de classes latérales de Forney [FOR 1988] a été abordée dans [KSC et 
al. 1989]. Ils ont ainsi abouti à une interprétation du codage MCB combiné à la modulation 
MDP qui est entiérement basée sur des propriétés des chaines de partition. 
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L4. THEORIE MODERNE DE LA MODULATION CODEE: 
QUELQUES SUJETS AVANCES. 


L4.1 MODULATION CODEE EN TREILLIS MULTIDIMENSIONNELLE. 


Le codage MCT multidimensionel est une nouvelle méthode de codage qui 
permet de réaliser des gains significatifs sans trop augmenter le nombre de signaux dans 
la constellation agrandie. Le premier code МСТ multidimensionnel, construit sur une 
modulation à 4 dimensions, a été proposé par Gallager [FOR er al. 1984]. En 1985, 
Calderbank et Sloane développaient indépendamment une famille similaire [CAL&SLO 
1985]. Cependant, ce sujet n'a suscité beaucoup d'attention qu'après la publication de 
l'article de Wei où étaient présentés divers schémas de МСТ à dimensions 4, 8 et 16 [WEI 
1987). En outre, Ungerboeck dans son article à P IEEE Comm. Magazine envisage aussi 
la modulation codée multidimensionnelle [UNG 1987]. Forney a classé les codes МСТ 
multidimensionnels selon une classification géométrique en classes latérales [FOR 1988]. 
Wei a repris le probléme de la recherche de codes invariants à l'ambiguité de phase et a 
découvert une famille de codes MCT/MDP multidimensionnels [WEI 1989]. La modulation 
codée en treillis multidimensionnelle sur une modulation de phase a aussi été récemment 
abordée par Pietrobon, Ungerboeck et autres [PIE et al. 1990]. 


Dans la MCT classique (c'est-à-dire un codage en treillis sur une modulation à 
deux dimensions), un bit de redondance est ajouté à chaque symbole non codé, ce qui a 
pour résultat une constellation agrandie dont la taille est double de celle de départ. Or, le 
coüt en puissance moyenne exigé pour cette opération est d'environ 3 dB (se reporter à 
1.3.1). Cette perte doit donc être compensée par le gain du codage. Dans la МСТ 
multidimensionnelle, on ajoute un bit de redondance toutes les 2n dimensions, autrement 
dit, à chaque bloc de n symboles MAQ. Par conséquent, on réduit le nombre de bits de 
redondance par symbole bidimensionnel et donc l'augmentation de la taille de la 
constellation constituante dont on a besoin pour le systéme codé. Pour une modulation 
codée MCT basée sur une modulation à 4 dimensions, le prix à payer dü à l'expansion de 
l'alphabet est réduit à 1,5 dB, tandis que pour une MCT à 8 dimensions cette perte devient 
0,75 dB environ. De plus, cette réduction de taille de la constellation constituante à deux 
dimensions permet de parvenir à une meilleure performance en présence d'autres 
distorsions que le bruit additif, telles que des non-linéarités ou gigues de phase. 
Cependant, il doit étre clair, quand on adopte cette stratégie, que le gain en distance 
euclidienne apporté par le codage (compte non tenu de la perte due à l'agrandissement des 
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constellations) est d'autant plus petit que la redondance introduite a. été plus petite. Le 
gain "net" du codage, étant le résultat du bilan entre ce gain en distance et la perte due à 
l'expansion, peut étre supérieur. Il est évident qu'il existe un compromis et que le gain 
final résultant du codage n'est pas d'autant plus grand que la dimension de la modulation 
constituante est grande. 


Il convient de rappeler que le codeur convolutif ne travaille pas à la cadence de 
modulation dans le cas d’une modulation codée en treillis multidimensionnelle. Pour une 
MCT sur modulation à 27 dimensions, le codeur ne travaille qu'à un rythme n fois 
inférieur à la cadence de modulation. 


Calderbank et Sloane ont présenté deux familles de MCT multidimensionnelles à 
huit états conçues sur une modulation à quatre dimensions dont les gains asymptotiques 
sont d’environ 5 dB [CAL&SLO 1985]. La première famille permet la transmission de 8 
bits par symbole à quatre dimension, soit une efficacité spectrale de 4 (bits/s)/Hz, avec un 
gain de 4,7 dB sur la transmission non codée MAQ 16. Elle est proposée comme un 
moyen de codage adapté aux modems à 9 600 bits/s sur le canal téléphonique à bande 
2400Hz. Quant à la deuxième famille, elle émet 12 bits par symbole à quatre dimensions 
et peut atteindre une efficacité spectrale de 6 (bits/s)/Hz; elle est ainsi appropriée aux 
modems à 14 400 bps sur le canal téléphonique. 


Wei a analysé plusieurs codes MCT multidimensionnels sur des constellations 
constituantes à 4, 8 et 16 dimensions [WEI 1987]. Il a montré comment sélectionner les 
constellations et comment réaliser une partition des ensembles telle que Ungerboeck Га 
faite pour la MCT sur une modulation à deux dimensions. Le codage MCT sur une 
modulation multidimensionnelle permet de réduire la taille de la constellation 
bidimensionnelle utilisée et partant d'obtenir une meilleure tolérance aux ambiguités de 
phase. D'ailleurs, ces codes présentent aussi un meilleur compromis entre la complexité 
etle gain de codage. 


Tretter a aussi introduit une MCT multidimensionnelle invariante à une rotation de 
90? de la phase, basée sur un code en treillis à 64 états qui permet la transmission de 4 
bits/baud (4 (bits/s)/Hz ) avec une constellation constituante d'à peine 20 points au lieu de 
la MAQ 16 [TRE 1989]. Ce codage atteint un gain de 5,23 dB par rapport à la modulation 
non codée 4X4 MAQ et méme 1,23 dB par rapport au code en treillis de la norme V.32 du 
CCITT [CCITT 1989]. 
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L4.2. CODES DE RESEAUX ET DE CLASSES LATERALES 
“Trellis codes are to lattice codes as convolutional 
are to block", G.D. FORNEY. 
14.21 RESEAUX 


"Lattices can be regarded as generalization of block codes, 
using Euclidean rather than Hamming weights". G.D. FORNEY. 


Soit B, une sphère à n dimensions centrée sur l'origine, de rayon p et de contenu 
V(B,) 2V,p", ой У, := ETC) est le volume d'une hypershère de rayon unité 
[p.ex. WOZ&JAC 1967]. 


Définition (empilements). 
Soit (v1,v2 ++} une suite infinie de vecteurs dans l'espace euclidien R”. On dit que 
l'ensemble (v; * B,, v2 +B, , :**) des sphères décalées par ces vecteurs forme un 


empilement si et seulement si elles sont disjointes deux à deux. On s'intéresse en particu- 
lier au cas ой la sphère B, a le plus grand rayon possible compatible avec la condition 
que les sphères décalées sont disjointes, ce qui implique un contact entre les sphères 
voisines. 


Un empilement est donc un arrangement d'une infinité d’hypersphères disjointes de 
méme taille (voir [SLO 1984]). Forney mentionne à juste titre [FOR 1990] qu'il était clair, 
dès les travaux originaux de Shannon, que le problème de parvenir aux empilements les 
plus denses dans des espaces à grand nombre de dimensions est essentiellement le méme 
que d'atteindre la capacité dans un canal à bruit blanc gaussien. 


La densité A d’un empilement est la fraction de l'espace couverte par les sphères (un 
terme mieux approprié pour désigner cette grandeur pourrait étre "coefficient de remplis- 
sage"). Il va sans dire que А S 1. Le problème de l'empilement de sphères consiste alors à 
choisir la position de leurs centres de facon à maximiser la densité qui en résulte. 


Une sphère quelconque de centre x appartenant à l'empilement est en contact avec un cer- 
tain nombre d'autres sphères, dont le nombre est appelé le nombre de contacts (kissing 
number) du réseau, noté tx). 


La densité de centres, 5, est la densité divisée par le volume d'une sphère de rayon 
unité, 6 := A/V,, c'est-à-dire le nombre des centres de sphères de l'empilement par unité 
de volume. 
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On simplifie grandement la recherche des empilements denses de sphéres dans les 
espaces multidimensionnels en ne considérant qu'une classe particulière d'empilements 
qui ont une configuration très régulière. Cette façon d'aborder le problème est analogue à 
la recherche de bons codes en bloc avec la contrainte de se restreindre à des codes 
linéaires. 


On dit qu’un empilement de sphères est un empilement de réseau, ou plus simple- 
ment un réseau si, quelles que soient deux sphères y appartenant, (l'une ayant pour centre 
le point Р; et l'autre le point P2), alors l'empilement contient aussi toutes les 
hypersphères centrées sur les points de la forme a Р; +b P? où a et b sont des entiers 
quelconques. Plus formellement, on définit: T 


Définition (réseau). 

Un empilement est appelé réseau s’il existe n vecteurs (V1,V2, ***,Yn) linéairement 
indépendants dans l'espace euclidien à m dimensions, R”,m2 "s tels que les centres des 
sphères sont l'ensemble de tous les vecteurs x = 04v, + ey 2+ 7 %Ө,у, où les 0; sont 
des entiers relatifs arbitraires. 


Ainsi, un réseau réel A est tout simplement un ensemble discret (non dénombrable) de 
vecteurs dans l'espace euclidien R" qui forme un groupe sous l'addition vectorielle ordi- 
naire. Ce concept a pour origine historique la cristallographie. 


Un réseau de rayon p est formé des centres {x;, x2, '::) vérifiant 
a? Qi, ху) 2 (2p)? , 1 # j. La distance euclidienne minimale entre deux points du réseau est 
donc Amin = 2p. 


Dans un empilement de type réseau, le nombre de contacts est commun à toutes les 
sphères: t(x) 2 1 Vxe A. 


Dans cette étude, on ne s'intéresse qu'à des empilements sur l'anneau des entiers 
relatifs. Leurs Légions fondamentales sont des polytopes, c'est-à-dire des régions 
convexes de R” limitées chacune par un nombre fini d'hyperplans. [CON&SLO 1982]. 


Définition (base d'un réseau - parallélotope fondamental). 
Les vecteurs lv. D’ У2, Vn} ci-dessus constituent une base du réseau. Le polytope 
(parallélotope) formé de tous les points de l'espace euclidien 

Givi + O2v2 +": t Өлу, 0<0 <1 


est dit le "parallélotope fondamental" du réseau. 
Définition (dimension d'un réseau). 


On appelle dimension d'un réseau A, notée dimA, le nombre maximal de centres 
linéairement indépendants. 
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Définition (matrice génératrice d' un réseau). 
% т а eo : 
Soit Л un réseau de dimension и dans l'espace К , n < т. On appelle matrice génératrice 


du réseau une matrice M constituée des coordonnées d'une base {v1, v5, `` vul, n £m, 
Soit 
Y1 
y 
Mx|- 
Yn 
Définition (matrice de Gram). 


Soit une matrice génératrice M. On appelle A := M М” une matrice de Gram du réseau. 


Définition (déterminant d'un réseau). 

Le déterminant d'un réseau est le volume de son parallélotope fondamental, c'est-à-dire, 
detA = det’? A. Si M est carrée, alors detA = |det M |. 

[Attention!: ce déterminant est quelquefois défini par detA = det A.] 


La densité d'un réseau (fraction du volume de l'espace euclidien couverte par les 
sphères de l'empilement) est donc 


A = —Yolume d'une sphère inscrite__ _ Vap” 
volume d'une région fondamentale detA ` 


Un paramètre d'un réseau très utilisé par les chimistes [BER 1969] est sa porosité, 
fraction du volume total qui n'est pas contenue dans les sphères de l'empilement: 
V:;1-A 


Définition (équivalence entre réseaux). 
On dit que deux réseaux A; et Аҙ sont équivalents, ce que l'on note A; ^ Ag, si, et seule- 
ment si, ils ne différent que par une rotation et un changement d'échelle. 


Définition (réseau dual). 

On dit qu'un réseau A+ est le dual d'un réseau A s'il est constitué de tous les points y du 

sous-espace de R Г engendré раг (у|,У2, °°° ,Vn) et tels que le produit scalaire 
о bl M 


X.y = Y, xj у; est un nombre entier quel que soit le point хе A du réseau. 
7 de 


Les réseaux autoduaux sont tels que A= A, ce qui revient à |detA| = 1. Mentionnons 
que les deux plus importants réseaux de la théorie des empilements, Eg et A4, sont des 
réseaux autoduaux. 
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Une région fondamentale d'un réseau quelconque A à n dimensions est définie 
comme une région de l'espace R” qui ne contient qu'un seul point de chaque classe 
d'équivalence modulo A. Bien entendu, il y a plusieurs fagons différentes de choisir une 
telle région, mais le volume qui en résulte est toujours le même. Il est appelé "volume 
fondamental" du réseau. Ainsi, la région fondamentale d'un réseau est en quelque sorte 
un motif qui pave tout l'espace euclidien de telle manière qu'un seul point du réseau se 
trouve dans chaque "pavé". De méme qu'il y a différents choix possibles d'une base, il 
existe un grand nombre de régions fondamentales différentes, mais le volume V (A) d'un 
"pavé" est determiné de manière unique par A. 


Autour de chaque point x du réseau, on définit sa région (ou cellule) de Voronoi, 
V (x), ensemble de tous les points de l'espace euclidien plus proches de ce point que de 
n'importe quel autre point du réseau. Plus exactement, 


у(х) = (xeR" :IIix-xlisIix-xll Visi) 


Puisque tous les points d'un réseau sont équivalents, il suffit de connaître la région 
de Voronoi entourant l'origine, V (0). Supposant que les points du réseau sont des mots 
de code, la régle de décodage à vraisemblance maximale consiste à prendre les régions de 
Voronoi comme régions de décision. 


Le volume d'une région de Voronoi peut être écrit en fonction des paramètres canoniques 
du réseau: 


V, n 
vol V(Q) = = Е = det 


Un des paramétres importants d'une région R est son deuxi&me moment adimen- 
sionnel, noté G,,(R) et défini par [CON&SLO 1982, FOR&WEI 1989] 


Пит? ave 


ar p; am 
Gn(R) = n d ay yim 
R 


Ce moment, lié à la forme de la région, mesure l'efficacité avec laquelle elle remplit 
l'espace pour un volume donné (compacité). 
Pour un cube à n dimensions, il vaut С, = 1/12 quel que soit n. П en est bien ainsi 
puisque le cube est le produit direct de segments linéaires. D'autre part, le deuxième 
moment d'une hypersphère à n dimensions (qui occupe le mieux l'espace avec une aire 
donnée) vaut 


п Un 
IC +1) 


n7 TM > He quand n о 
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Calderbank et Ozarov ont récemment étudié l'amélioration des performances qui 
résulte de l'utilisation de schémas ой 1а distribution des points de 1а constellation n'est 
pas équiprobable [CAL&OZA 1990]. Il y est décrit comment s'approcher du gain de forme 
(shape gain) maximal quel que soit le nombre de dimensions considéré. 


Définition (changement d' échelle d' un réseau). 

Le changement d'échelle d'un réseau (ou d'un empilement) A par une constante réelle 
positive c a pour résultat le réseau cA := (cx : xe А) dont les principaux paramètres sont 
[SLO 1981): 


p(cA) = cp(A), dim(cA) = dimA, M (cA) = cM (A), det(cA) = c iP^ detA, 
A(cA) = A(A), cA) = &(A), ех) = tx), Ө.д(2)- Өд(с?2), et (CAY c! AT. 


Décomposition. 
Soit L un réseau tel que L = Y (cj + A). Les vecteurs с), j = 0, 1, ..., 1-1 sont appelés les 


os de classes иса (coset representatives) de А dans І, et 
= |L |/|A] = det L/det A est dit l'index de A dans L. 


Considérons par exemple Eg = (0 + Dg) U (1/28 + Dg). Dg a pour représentants dans 
Eg les vecteurs (0,0,0,0,0,0,0,0) et (1/2,1/2,1/2,1/2,1/2,1/2,1/2,1/2) et son index y est 
deux. 


La plupart des réseaux étudiés sont contenus dans leur dual [CON&SLO 1988,p.48], de 
sorte qu'il existe des représentants С0,С1,...,64-1 tels que 
4-1 
=U (c +A) 
j=0 
d étant l'index de A dans A+. 


Un arrangement quelconque d’hypersphères qui ne se chevauchent pas (un empile- 
ment) ne suffit pas à couvrir tout l'espace euclidien, quel que soit le nombre n des dimen- 
sions avec n > 1. 


Un autre probléme classique fortement lié à l'empilement de sphéres consiste à 
couvrir tout l'espace avec des hypersphères non disjointes. Dans се cas, le but est de 
trouver, dans l'espace euclidien à n dimensions, le pavage le plus économique. Autrement 
dit, il s'agit maintenant de minimiser les régions de chevauchement en faisant un choix 
approprié des centres des hypersphères. Ceci est connu sous le nom de probléme du 
"recouvrement" ou du "remplissage total" de l'espace. 


Définition (rayon de recouvrement). 
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Le rayon de recouvrement d'un empilement (réseau) est défini par le supremum de la dis- 
tance euclidienne minimale entre deux points quelconques [CON&SLO 1988] 

r:= Sup Inf d(x, 
ар PA E М 
Bien évidemment, l'ensemble des sphères de rayon г centrées en chaque point d'un 


réseau suffit à recouvrir l'espace euclidien tout entier, propriété qui cesserait d'être vraie 
pour un rayon plus petit. 


Les paramètres d’un recouvrement sont définis de la même façon que ceux d’un 
réseau. D'abord, l’épaisseur d’un recouvrement, ©, définie par 





ө = Volume d'une sphère circonscrite _ VOS 
' volume d'une région fondamentale detA ` 


П va de soi que © 2 1, alors que l’on a AS 1 pour la densité d'un réseau. 


On définit aussi l'épaisseur normalisée d'un recouvrement de facon analogue à celle de la 
densité de centres 5 d'un réseau, soit Ө := Ө/У,. 


Pour un empilement du type réseau ayant des cellules de Voronoi congruentes aux 
régions fondamentales, V (A), le rayon de l'empilement p est celui de la sphere inscrite 
(inradius) dans V (A) tandis que le rayon de recouvrement r est celui de la sphère circon- 
scrite (circumradius) à V (A). 


Définition (série théta). 
La série théta d'un réseau A est définie par 


QAQ):- >; gel = E N,q" 
mz 


хєл 


od 4 -ехр(ліг), ism. 


Il suffira ici d'interpréter O4 comme une série formelle de puissances d'une indéterminée 
q, mais des investigations plus profondes devraient la considérer comme une fonction 
analytique de la variable complexe z, pourvu que IM(z) > 0. En outre, on remarque que la 
série O est déterminée par le réseau A, mais que l'inverse n'est pas vrai [CAL&SLO 
1988,p.47]. 


On obtient la série théta du réseau dual A? à partir de la série du réseau A selon: 
O4: (z) = (detA)? (i/z)? @, (-1/2) 


Cette identité peut étre considérée comme une généralisation aux réseaux de l'identité de 
MacWilliams des codes en bloc linéaires [MacW&SLO 1977]. 
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La détermination de 1а plus grande densité que peuvent atteindre des réseaux dans 
des espaces à grand nombre de dimensions reste un problème ouvert. Herman Minkowski 
démontrait en 1905 l'existence, pour toute dimension n, d'empilements de réseau dont la 
densité est supérieure à exp? (71) [CAS 1959]. Tout comme d'autres déjà mentionnées, sa 
démonstration n'est pas constructive et aucune famille de réseaux ayant cette densité n'a 
jamais été construite. 


La borne inférieure de Minkowski sur la densité d'un réseau est 
A2 C(n)/ ехрг(п-1) 


ой Gn) := Y, k™ est la fonction zéta de Riemann [ABRA&STE 1972]. 
kx] 


Quand n о, alors Іор:А 2 -n +1. 


Du cóté des bornes supérieures, Blichfeldt démontrait en 1914 que, pour un nombre 
de dimensions arbitrairement grand, la densité d'un empilement ne pouvait excéder 
environ exp2(—0,5n) [SLO 1984]. Le méme résultat peut être obtenu par la borne de 
Rogers sur la densité de centres d'un réseau [LEECH 1967], 


logó « os ut Žiogn - log—— т + EM 


Ainsi, les réseaux les plus denses dans l'espace euclidien R” à nombre de dimen- 
sions assez élevé possèdent une densité satisfaisant à la double inégalité: 


=n $log2A < -0,5n . 


Plus récemment, G. Kabatiansky, V. Levenstein et V. Sidel'nikov ont montré que, 
pour tout nombre de dimensions assez grand, la densité d'un empilement de réseau ne 
peut dépasser environ exp2(-0,599n) [CON&SLO 1988). 


Barnes et Sloane ont présenté des constructions explicites d'empilements de réseaux 
dans l'espace R” , n 598 328, dont la densité est d'environ A = exp2(-1,25n) [BAR&SLO 
1983]. » 


Les bomes sur l'épaisseur du meilleur recouvrement à nombre de dimensions n 
assez grand sont [CON&SLO 1988]: . 


n 
— = $O<ninn+nininn+5n 
eve 


Transformation orthogonale d’un réseau. 
On note T une transformation orthogonale avec ou sans changement d’échelle. 
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L'application de T à un réseau A quelconque, ТА, est encore un réseau. On пе s'intéresse 
ici qu'à un opérateur de rotation de 45°, noté R. (Bien entendu, cela définit un réseau 
équivalent.) 

L'opérateur bidimensionnel de rotation est 


nos fel 


tandis que pour n dimensions, n pair, il est donné par 


R 0 0 0 
QU ОНА О 
R=|0 0 R D 
... 0... -0 
GD, DR 


matrice (n/2)x(n/2) dont chaque entrée est une matrice 2x2. Le réseau RZ? se déduit 
donc de 22 par une rotation de 45° et un changement d'échelle de V2. On voit aisément 
que R? = 27, I étant la matrice identité à n dimensions. 


Réseaux Z": 


Les réseaux cubiques à n dimensions correspondent à la grille formée de tous les points 
dont les coordonnées sont des nombres entiers quelconques. Il s'agit d'un réseau auto- 
dual, Z” = (Z"Y. 

Z" = ((1,X2,..,Xn) : eZ]. 


Sa série théta estOz(2)= Y q” =1+ Y 24". 
mao 


mul 
Réseaux A,: 


Pour n 2 1, А, est un réseau à n dimensions formé de tous les points (xo, x1, ..., Xn) 
ayant des coordonnées entières dont la somme est nulle. Il est donc défini dans un espace 
ат = n + 1 dimensions. Le réseau le plus connu de cette famille est le réseau hexagonal à 
deux dimensions А з. On remarque encore que Аҙ ~A2+. 

An = {OX x2,x,)6Z27 1 : Y x; = 0). 


Réseaux D,,: 


Le réseau D, à n dimensions est formé de tous les points (х1, X2, ..., Xn) ayant des 
coordonnées entières dont la somme est un nombre pair. Ces réseaux sont aussi appelés 
"réseaux échiquier". En effet, un réseau de cette famille se déduit du réscau cubique en 
prenant les centres des sphères en quinconce sur le réseau, comme on dispose des cases 
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noires et blanches sur un échiquier. Si l'on colorie les noeuds d'un réseau cubique alterna- 
tivement en rouge et en blanc, le réseau D, correspondant est formé alors des points 
rouges. Le plus important réseau de cette famille est D 4, connu sous le nom de réseau de 
Schläfii. 

D, = {(r1,x%2,..,%x,)eZ7 : Y x; est pair]. 


Réseau Eg: 


Découvert en 1900 par T. Gosset, ce réseau est formé de tous les points de l’espace eucli- 
dien (х1, x2, ..., xg) ayant des coordonnées de la forme x; е 2 ou x; е Z+1/2 et dont la 
somme est un nombre pair. 

Les vecteurs les plus proches de l'origine (vecteurs minimaux) sont 112 vecteurs du type 
(12, 06) et 128 vecteurs du type (31/28) ayant un nombre pair de signes négatifs. Le 
nombre total de sphères en contact est donc 1 = 240. 


Réseau de Leech A254: 


En 1964, Leech montrait que le code (parfait) de Golay pouvait étre incrusté dans un 
objet encore plus fascinant: le réseau de Leech [LEECH 1967). П est formé de tous les 
points de l'espace euclidien à 24 dimensions dont les coordonnées obéissent aux deux 
conditions: 

1) Chaque point du réseau est, modulo 2, congruent à un mot du code de Golay étendu 
(24,12,8). 

2) La somme modulo 4 des coordonnées de n'importe quel point du réseau est nulle. 

Les centres pairs les plus proches de l'origine ont deux coordonnées t4, ou bien huit 
coordonnées +2, toutes les autres étant égales à zéro. On les note (342,022) et (225,016); 
il y a 98 256 points avec des coordonnées de cette forme. Les centres impairs les plus 
proches de l'origine ont vingt-trois coordonnées +1 et une seule coordonnée +3, soit 
(3123 +3). Il y а 98 304 points avec des coordonnées de cette forme. Le nombre total de 
sphères en contact est donc т = 196 560. Des détails sur l’histoire de la découverte de ce 
réseau peuvent étre trouvés dans [THO 1983]. 


Enfin, mentionnons que des groupes peuvent étre associés à la structure d'un réseau. 
En particulier, on appelle groupe d'automorphisme Aut(A) d'un réseau A l'ensemble des 
transformations (rotations et r<e’>flexions) de l'espace qui laissent l'origine invariante et 
appliquent le réseau sur lui-même [CON&SLO 1988). 
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TABLEAU VII. PARAMETRES DES PRINCIPAUX RESEAUX 
A FAIBLE NOMBRE DE DIMENSIONS. 





TABLEAU VIIL PARAMETRES DES PRINCIPAUX RESEAUX 
A FAIBLE NOMBRE DE DIMENSIONS (suite). 


m n»? [a (m -a) 2 
n^ 227131 


1 
(8л/3)6/19440 86/39 

12/16 8! (31)5/16 8! 38/42 

72/12! (2л)!2/12! 22 





Leurs séries thêta respectives sont données par [SLO 1981]: 
Oz" (z) = [Gz(z)]", où Oz(z) = 1 + 27 + 244 + 2416 + --- 
Op, (2) = 1 + 2442 +96q6 + 244% + 144410 + --- 


Oz, (z) = 1 + 24042 + 21604 + 67204 + ··· 
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Oy, (2) = 1- 7564* + 4032p% + 2041298 + 60480410 + - 
Өл,(2) =1 + 43204 6144048 + 5227204 + --- 
Өл, (2) = 1 + 1965604“ + 1677312045 + ·: 


Dans le but de comparer différents réseaux n'ayant pas le méme nombre de dimen- 
sions, il serait souhaitable de normaliser la mesure de densité à un méme nombre de 
dimensions. Normalement, on le fait en choisissant la dimension 2 pour permettre une 
comparaison avec le réseau non codé 22, Pour une vue plus globale, оп peut considérer 
un réseau à n dimensions, ayant la densité D, que l'on rapporte à un nombre de dimen- 
sions n’, soit D""" (de Oliveira). 


TABLEAU IX. DENSITE DES RESEAUX Z?, E; et Au, 
RAPPORTEE A 2, 8 ET 24 DIMENSIONS. 


o is 





Un tableau similaire pour la densité de centres est: 


TABLEAU X. DENSITE DE CENTRES DES RESEAUX Z?, Ey et Au, 
RAPPORTEE A 2, 8 ET 24 DIMENSIONS. 


питата Тана 
A 1/4 | i256 | y —— 
= Eu 1/ À 


De toute évidence, bien que l’agrandissement de l’espace conduise à une diminution 
de la densité, on s’aperçoit qu'il entraîne un accroissement de la densité de centres - 
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paramétre en rapport étroit avec le débit d'information. 


Gersho et Lawrence ont bien saisi l'importance des réseaux comme technique de 
codage pour apporter des gains importants sur le canal gaussien [GER&LAW 1984]. Is ont 
présenté une mise en œuvre trés intéressante du codage/décodage à 4 et 8 dimensions et 
ont analysé les gains ainsi obtenus. Quoique leur notation ne soit pas la méme, le premier 
système correspond exactement au réseau D 4 dont le gain théorique est 1,51 dB par rap- 
port au système non codé ayant le même débit (le gain mesuré a été 1,2 dB). Le deuxième 
systéme correspond au réseau de Gosset Eg dont le gain est 3,01 dB (le gain mesuré a été 
2,4 dB). On trouve dans leur article le schéma d'un décodeur pratique pour des codes de 
réseau. Ils ont aussi indiqué la possibilité trés attrayante d'utiliser le réseau de Leech. 
Enfin, ils ont vérifié expérimentalement que le codage par un réseau à 4 dimensions ne 
change en rien la densité spectrale en ligne, ce qui est un cas particulier d'un des résultats 
originaux de cette thése: un code de réseau quelconque ne modifie pas le spectre du signal 
(voir l'annexe de la section III.2.). 


Wilson et collaborateurs ont étudié la construction de jeux de signaux à 4 dimen- 
sions à l'aide d'une technique (frequency-reuse) qui utilise deux champs 
électromagnétiques avec polarisation orthogonale sur 1а méme porteuse de facon à dou- 
bler l'efficacité spectrale [WIL et ai. 1984]. Ils décrivent des modulations à 4 dimensions 
qui correspondent exactement aux réseaux 24, Ag et D 4. Ils trouvent que les meilleures 
performances sont obtenues avec le réseau D 4, comme on pouvait s'y attendre. 


Le décodage de réseaux particuliers peut être mis en œuvre en exploitant des 
propriétés mathématiques intrinséques du réseau pour en réduire la complexité. Bien des 
travaux on été consacrés à ce sujet, ainsi pour les réseaux de Gosset [CON&SLO 1982, FOR 
1988, SEC-deB 1989] et de Leech [CON&SLO 1986, FOR 1988, LAN&LON 1989, BE'E et al. 1989, 
FOR 1989]. Par exemple, la complexité du décodage du réseau de Leech a pu étre réduite 
successivement de 56 000 opérations à 15 000, 10 000, puis 8 000 et finalement à moins 
de 2 000 opérations pour un décodeur sous-optimal ayant par rapport à l'optimalité une 
perte estimée à 0,1 dB! 


Leeuwin-Boullé et Belfiore ont cherché des constellations basées sur un empilement 
de sphéres et bien adaptées aux canaux avec évanouissement de Rayleigh [LEE ег a! 1991]. 
Dans l'espace à deux dimensions, ils ont trouvé une nouvelle constellation, optimale pour 
ce canal, qui y est donc meilleure que le réseau hexagonal А: optimal en l'ansebce de 
fluctuations. Il lui est équivalent, se déduisant de А2 par une rotation de 45? et un change- 
ment d'échelle dont le facteur dépend du rapport signal à bruit moyen. 
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1.4.2.2 CODES DE CLASSES LATERALES. 


“Trellis Codes are to lattice codes as 
convolutional are to block" С.р. FORNEY. 


Forney ег al. ont remarqué en 1984 que les techniques de modulation codée 
pouvaient étre vues comme une combinaison, d'une part d'un codeur binaire classique 
(en bloc ou convolutif) dont les bits codés sortants sont utilisés pour sélectionner un des 
sous-ensembles d'une partition de la constellation, et d'autre part, de bits non codés 
additionnels utilisés pour choisir un seul point parmi tous ceux du sous-ensemble 
sélectionné [FOR et al. 1984]. Calderbank et Sloane ont envisagé la modulation codée du 
point de vue des réseaux et classes latérales, ce qui a été probablement la plus grande 
contribution conceptuelle apportée au codage-modulation depuis les travaux 
d'Ungerboeck. Dans leur remarquable article (CAL&SLO 1987], ils proposent une 
interprétation alternative (voire plus rigoureuse) de la technique de partition des 
ensembles d'Ungerboeck en termes de partitions de réseaux. En 1988, Forney a réussi à 
généraliser la théorie du codage-modulation en rassemblant tous les schémas connus sous 
un méme formalisme mathématique: les codes de classes latérales (coset codes) [FOR 
1988]. 

Définition (classe latérale ou coset). 
Soit U une classe (abstraite) d'objets munie d'une opération binaire (abstraite) d'addition 
Ф telle que «U,G» est une classe fermée par rapport à l'addition. Soit C une sous-classe 


de U (U 2 C). Etant donné un élément y quelconque, on appelle l’ensemble y+C := 
(ux : x eC) une classe latérale (coser) de C. 


On peut constater aisément que deux classes latérales sont disjointes à moins 
qu'elles ne coincident [MacW&SLO 1977,p.15]. Géométriquement, les classes latérales 
correspondent à un pavage de l'ensemble C. 


Calderbank et Sloane ont remarqué avec justesse qu'il ne s'agit pas à proprement 
parler d'une nouvelle façon de coder, mais plutôt d'une nouvelle manière (plus 
performante, cela va de soi) d'aborder la technique de partition des ensembles 
d'Ungerboeck. La partition de la constellation de signaux en sous-ensembles ayant des 
distances euclidiennes qui augmentent à mesure que l'on progresse dans la partition 
(c'est-à-dire que le niveau, ou la profondeur, de la décomposition en sous-ensembles 
augmente) correspond à une partition d'un réseau en les classes latérales d'un sous- 
réseau donné. 
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Les codes de classes latérales sont donc des séquences de cosets d'un sous-réseau 
A' dans la partition A/A' d'un réseau binaire A. Ainsi, une partie des bits non codés 
entrants est utilisée pour un codage convolutif généralisé dont la sortie désigne des 
classes latérales (cosets) du réscau A' tandis que l'autre partie est employée pour 
sélectionner un point dans les classes latérale ainsi choisies. 


Un code de classes latérales est donc défini à partir des éléments suivants: 
d'abord, un réseau binaire A (se rapporter à la section précédente). Ensuite un sous- 
réseau A’ (A2A") lequel définit une partition A/A” (le groupe quotient) ayant 
=lA/A'l=2X* cosets de A’ dans A. Enfin, un code correcteur d'erreur binaire de taux 
k/(k+r). En résumé, 


* À réseau (constellation) 
* A’ sous-réseau (sous-constellation) 
+ A/A? partition du jeux de signaux en IA/A'I classes latérales (ordre de la partition). 


* Un code binaire C. 


Un code de classes latérales C(A/A”;C) est l'ensemble de toutes les séquences de 
points dans le réseau (binaire) A, décomposé en classes latérales de A', correspondant à 
la séquence de classes latérales que spécifie un train de bits codés selon un code binaire 
(classique) C. Cette généralisation peut inclure tous les schémas de codage-modulation 
connus, y compris les codes de réseau et les modulations codées en treillis MCT et en bloc 
MCB. 
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classe latérale: 


codeur binaire 












k bits HNIC 
(ios) (bloc ou convolutif)| K* bits 


partition A/A 
(codés) 





ker 
Une parmi les 2 


classes du réseau A' 
m-k bits additionels 
(non codés) Selecteur d'un 


| point dans la 
classe latérale 











mer 
un parmi les 2 


points de la constellation 


totale m bits/T avec expansion de l'alphabet 


CHAPITRE I: Théorie moderne de la modulation codée 68 


Figure 10. Structure générale d'un code de classes latérales C(A/A”;C). 


Il y a 2K*! cosets x 2™-* points/coset, soit un total de 2M*" points. Le débit de 
transmission d'information par deux dimensions est donc m bits/2D (bits/T). 


Le sous-réseau A' provoque une partition de A (notée A/A") en classes 
d'équivalence modulo A”. Il y at =1A/A”! telles classes (l'index de A’ dans A), valeur 
appelée l'ordre de la partition. Si l'on ne prend qu'un élément de chaque classe 
d'équivalence, alors on obtient un système de représentants des classes latérales de la 
partition, que l'on note [A/A’]. Il est trés important de souligner la relation suivante entre 
les volumes fondamentaux des deux réseaux [FOR 1988, Lemme 1]: 


V(A’) = IA/A’! УСА). 
Décomposition en classes latérales (coset decomposition). 


t-1 
A= U (е +A’ } , Ou en reprenant la notation de Forney, A = A’ + [A/A’]. 
j=0 


Quelques exemples trés naifs illustrent la décomposition de réseaux simples en 
classes latérales: 


Partition ordre de la partition cosets formule de décomposition 


7/22 12/221= 2 [2/22] = ((0.0) 2/22. = 2Z VU 2Z+1 
ZZ 1728221:2 (|72872-(00)(10) Z?-((04RZ2)U ((1,0)+672) 


Z/mZ 12/т2]) = т [Z/mZ] = (01..т) 2/т2, = "Ut + mz) 
Я ј=0 

Le premier exemple fait une partition de l'ensemble des entiers en entiers pairs et 
impairs. La deuxième partition scinde la grille bidimensionnelle des entiers en deux sous- 
ensembles (en fait, deux sous-réseaux) qui correspondent au premier niveau de la 
partition d'Ungerboeck pour la modulation MAQ. Le troisiéme montre une partition des 
entiers dans m classes d'équivalences modulo m. Tout entier i peut être écrit d'une façon 
unique i = km + j, ой km est un élément du réseau mZ des entiers multiples de т. Ainsi, j 
est le représentant de la classe d'équivalence de tous les entiers tels que i = j mod т. 
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haín ition 


On appelle chaîne de partition en classes latérales et l'on note A/A’/A’’/A’’’/... 
une suite de partitions provoquées par des réseaux emboîtés ADA'2A''2A''*2... 


Par exemple, la suite de réseaux Z*2D 42 RZ^ induit une chaine de partition 
74 4 MRZÍ. La premiére partition, Zn y» décompose le réseau Z^. Le réseau D,, quant à 
lui, il peut être décomposé selon la partition correspondant au groupe quotient D 2А : 


Un exemple assez éclairant présenté par Forney consiste en la chaine de partition 
7/27/47/... de sous-ensembles d'entiers. La chaine de décomposition en classes latérales 


que Гоп en tire, Z = [2/22] + [22/42] + [42/82] +..., amène directement à la 
représentation binaire d'un nombre entier m arbitraire, m = dp + 2a, + 4a, Faia 


Décomposition en chaîne de classes latérales (Coset decomposition chain). 


Un réseau peut étre décomposé en fonction des classes latérales d'une chaine de partition. 
Pour une chaine A/A’/A’’/A’’’/... donnée, 


A=[A/A + [AA] + [A/A] ж... 


Des exemples intéressants de décomposition en chaine de classes latérales peuvent étre 
obtenus à partir des chaines de partition suivantes: 


2/22/42... 
ZIRZ/2Z/2RZ|4Z |... 
2218722721272 12672 / 4224.7 
Z' / D, I 8221 RD,/ 2Z* / 2D, / 2824... 


Un réseau binaire est une généralisation des codes binaires en bloc. Forney a 
effectué la décomposition de la plupart des réseaux importants de dimension inférieure à 
24. Cependant, il a remarqué l'existence de quelques réseaux indécomposables. 
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On résume ici des résultats de décomposition de réseaux binaires: 


1») Un réseau réel à n dimensions est un réseau binaire modulo 2 si, et seulement si, il est 
constitué de l’ensemble de tous les n-uples congruents modulo 2 à l'un des mot d'un 
code en bloc linéaire binaire (n,k), С. 


А = 229 + С (Formule clé de la décomposition). 
Cette formule explicite le réseau comme étant l’union de 2% cosets de 221 


Exemples: Le réseau de Schläfli D, = 274 + (4,3,2), ce que l'on notera dorénavant D, € 
(4,3,2). On a alors: 


229 (2,2,1), RZ? © (2,1,2), 22?e Q0, 

25-ал), Dy (43,2), RZ‘ е 422), ВЮ, (414, 224 < (405). 

2») Un réseau réel à n dimensions est un réseau binaire modulo 4 si, et seulement si, il est 
décomposable selon 

А = 42" +2C, + Cy (Formule clé de la décomposition). 


Exemple: Le réseau de Barnes-Wall A16 = 4716 + 2(16,15,2) + (16,5,8). 


Soit le code en treillis d'Ungerboeck basé sur un code convolutif dont le treillis a 
4 états destiné à la transmission de 5 bits/2D et dont le gain fondamental est de 3,01 dB. 
La modulation non codée ayant le même débit d’information utilise une constellation MAQ 
à 25-32 états. La modulation codée est fondée sur une constellation agrandie du type 
MAQ à 64 états. La technique de partition d'Ungerboeck interprétée en termes de classes 
latérales correspond au choix suivant: 


6А =Z? le réseau bidimensionnel des entiers”, 
+ A' 2222. le réseau bidimensionnel des entiers pairs. 


La partition A/A” est donc 72/272 dont l'ordre est 122/272 = 4 comme le montre 
la figure 11 ой les quatre classes latérales sont représentées. 
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Figure 11. Une partition 22/22? sur un jeux de signaux à 64 états. L'ordre de la partition 
est 122/2221 = 4. Les quatre classes latérales sont représentées. 


Lorsque l'on envisage les distances euclidiennes pertinentes à un tel processus de 
codage, deux types de distances interviennent: 


d :- MIN 1111 = d min (А), 
хє À’ 
1*0 
et 
Ф := MIN Ilx-yll2=dy(C). 


x*y 


La premiere distance, d^ is (A), est le carré de la distance euclidienne minimale 
entre deux points quelconques dans une méme classe latérale de А”. Dans le diagramme 
de treillis du code, cela équivaut aux distances entre les transitions parallèles d'une méme 
branche. La deuxiéme distance correspond quant à elle à la distance de Hamming 


minimale du code convolutif (ou en bloc), compte non tenu des branches paralléles 
ajoutées. 


La distance euclidienne minimale d'un tel code de classes latérales est, bien 
évidemment, donnée par 
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d^ min (©) = MIN (is (A) (O), 


ou, en employant la notation de Calderbank et Sloane [CAL&SLO 1987] (à ceci pres que 
l'on utilise le carré de la distance lui-même au lieu de le noter d) 


d? = MIN (22,22). 


Dans la partition de la figure précédente, le carré de la distance euclidienne 
minimale entre deux points d'une méme classe latérale de 22? est Ф, = dai (^) =4, 
Le code convolutif est choisi quant á lui de fagon que Ф үа (С) = 5. Le carré de la 
distance euclidienne minimale est donc Фа = MIN (5,4) = 4. Le gain asymptotique (ou 
gain fondamental de Forney) est alors de 3,01 dB. 
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Figure 12. Code de classes latérales correspondant au code en treillis d'Ungerboeck basé 
sur un code convolutif avec treillis à 4 états, destiné à la transmission de 5 bits/2D et dont 
le gain fondamental est 3,01 dB. 


Outre l'introduction d'une nouvelle technique pour la construction de codes 
MCT/MCB, Calderbank et Sloane ont aussi évalué les gains asymptotiques 
(fondamentaux) apportés par des codes congus selon ces nouveaux principes. En 
reprenant la notation de Forney [FOR 1988], on écrit 
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LS 


m = IT 2200 et ру = К1орза / logaTl = L— 


logoa bits/coset; 
d'où ml = 2 2k/n 10824. 


Théoréme (Calderbank-Sloane). Le gain asymptotique (en décibels) apporté par un code 
de réseau de dimension n est donné par 


СА) = 10 og, "32. д2 


Théoréme (Calderbank-Sloane). Le gain asymptotique (en décibels) apporté par un code 
de classes latérales est donné par 


2 
G(C) = 10 log, 22 + д2/" 22k/n logpa 
2 


Un point de vue personnel, 
Il est possible d'interpréter la МСТ, en faisant appel à la théorie des codes de 
classes latérales, comme étant une construction de réseau de dimension infinie. 


C(A/A’;C) est un empilement de dimension infinie dont les paramètres sont: 
• rayon de l'empilement: 
P = тіп (C)/2; 
in (C) = MIN (min (A*)dg(C)). 
* volume d'une région fondamentale (determinant de l'empilement): 
VC) = det C = 2-6 V(A”) = 2^* V(A); 
V(A’) = det (A’) et V(A) = det (A). 
* densité de l'empilement: | 


ҚҰЛАП 2 
detC VC) 
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* densité de centres: 
л л n/2 
(C) = Yeoh pr ed [fni min C) ] ^g,» 
det VC) 257445 (АУ 


* densité de centres rapporté à deux dimensions: 


Гаво OT gama», 


2/п 





Ainsi, les formules des gains fondamentaux (gains asymptotiques) selon Forney 
ou Calderbank-Sloane [FOR 1988, CAL&SLO 1987], soit: 


d^ gin (A) 
YA) : eR codes de réseau, 


Y. C 00 codes de classes latérales, 

peuvent être récrites ainsi d'une façon plus convenable (voir aussi sec.III.2): 
VA) := 4 BA) = SAYS MZ), 
YVE) := 4 SC) = ¿cys nz», 


Qu'il s'agisse de codes de réseau ou de classes latérales, les relation précédentes 
mettent en évidence que le gain apporté par le codage est essentiellement dü à 
l'amélioration de la densité du jeu de signaux par rapport au système поп codé Z”. 


Ainsi, les gains asymptotiques donnés par Calderbank et Sloane (voir les 
théorémes précédents) peuvent étre séparés en contributions dues à la forme et au codage: 


СКА) = 1010 1,(А) YLA) = YA) + YA) (dB), 
G(C) = 10 logy YC) 1,0) = KO) + 1,6) (dB. 


Dans les deux cas, le gain de forme est donné par le gain d'une région sphérique 
par rapport au cube à п dimensions [FOR ег а! 1984,table Ш) [FOR&WEI 1989]: 


n+2 n+} n 


YA) = YO = 37 D Va 2/n =E py 





n':=n/2. 
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Tous ces résultats coincident avec les expressions des gains fondamentaux 
trouvées par Forney [FOR 1989]. 


TABLEAU XI. 


GAIN THEORIQUE DU MEILLEUR RESEAU CONNU A PLUSIEURS DIMENSIONS. 


amemon | ша |08 | yw | yw 
m 





(comparer au Tableau XIV p.192 [CAL&SLO 1987] et au Tableau IV p.640 [FOR et al. 
1984]). 


TRAVAUX PERSONNELS 


*My mind wanders around, and I conceive of different things 
day and night. Like a science-fiction writer, I'm thinking, 
What if it were like this? or, Is there an interesting problem 
of this type?, and I'm not caring whether someone is 
working on it or not". 


C.E. SHANNON. 
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IL1. CONSTELLATIONS EN CROIX GÉNÉRALISÉES ET CANAL SECON- 
DAIRE OPPORTUNISTE 


RÉSUMÉ 


On introduit un étiquetage binaire optimal des symboles d'une constellation carrée. Il 
permet une détection rapide pour les systèmes de modulation d'amplitude en quadra- 
ture (MAQ) au sens étroit. Ensuite, une famille de constellations en croix généralisées, 
à deux dimensions, est présentée ainsi que des bornes supérieure et inférieure de leur 
probabilité d'erreur par symbole sur un canal idéal à bande limitée, qui généralisent les 
bornes déjà connues pour la MAQ classique. L'application de ce schéma à un canal 
secondaire opportuniste est analysée et l'on montre comment des débits fractionnaires 
(en bits par signal à deux dimensions) peuvent être obtenus sur des systèmes МАО 
généralisés. Ces schémas de communication sont comparés aux constellations multidi- 
mensionnelles généralisées récemment introduites par Forney et Wei. 


ON GENERALIZED CROSS CONSTELLATIONS AND 
THE OPPORTUNISTIC SECONDARY CHANNEL 
ABSTRACT 


An optimum bits-to-symbol mapping for square constellations is introduced which 
allows a fast detection in narrow-sense QAM systems. Then, a family of two- 
dimensional generalized cross constellations is presented as well as upper and lower 
bounds on the symbol error probability over an ideal band-limited channel which gen- 
eralizes those previously known for conventional QAM. The application of this 
Scheme to the opportunistic secondary channel is analysed and it is shown how frac- 
tional rates (in bits per 2-dimensional signal) can be supported on 2D generalized 
QAM systems. These signaling schemes are compared with multidimensional general- 
ized constellations recently proposed by Forney and Wei. 
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11.1.1. INTRODUCTION 


Digital schemes with coherent amplitude and phase modulation have long been 
used in data communication systems [1]. A clear example of this use is the broad 
commercial success of Quadrature Amplitude Modulation (QAM) in both MODEMs 
on telephone lines and digital microwave radio links. Over the additive white Gaussian 
channel (AWGN), Shannon's capacity theorem asserts that the maximum achievable 
rate (in bits per dimension) with virtually error-free communication solely depends on 
the signal-to-noise ratio (SNR). However, it seems more interesting to consider a nor- 
malized rate in bits per two dimensional signal (bits/2D) rather than in bits per dimen- 
sion. For a band-limited channel with a bandwidth of B hertz, the normalized rate 
exactly equals the spectral efficiency in (bit/s)/Hz of a system admitting a signaling 
rate of 2B dim/s [2]. 

The average noise power in the channel is N = NoB, No being the noise one- 
sided power spectral density. Assuming that the average received signal power is con- 
strained to be equal to $, then the capacity C of the Gaussian channel is given by 


C =1log2(1+S/N)  bits/2D or (bits/s)/Hz. (1) 


A more conservative estimate of the possible rate is the cut-off rate Ro which is given 
for this channel by [3] : 


Ro = logi (1-257) bits/2D or (bits/s)/Hz. (2) 


Let us consider the telephone channel as an example. Of course, other impair- 
ments beside the additive noise are present on the voiceband channel, but we assume 
that disturbances like nonlinear distortion, phase jitter, frequency offset, etc, are con- 
trolled on private special conditioned lines so that the additive Gaussian noise becomes 
the main impairment. For a signal-to-noise ratio of about 28 dB, the following limits 
are found: Ro = 8 bits/2D and C = 9 bits/2D. The ceiling 19.2 kbits/s proposed in [4] 
corresponds exactly to the cutoff rate above when B = 2,400 Hz. At present, we have 
commercial MODEMs (with coding) working at 7 bits/2D or 7 (bits/s)/Hz, a rate fairly 
close to the cut-off rate. The rate increase from near the cut-off rate towards the capa- 
city can be expected to be very hard. The usefulness of fractional rates in such a 
region becomes obvious. Still, transmitting a non-integral number of bits/2D is becom- 
ing common with the advent of coded multidimensional constellations, after Wei's 
paper [5]. In coded systems, a precise coding gain estimate involves its comparison 
with an uncoded system of same spectral efficiency, without sacrificing rate nor requir- 
ing more bandwidth [6]. Section 2 excepted, this paper is mainly concerned with 
transmitting at fractional rates and with uncoded modulation schemes able to support 
these rates. The aim of this work is not to find good (dense) constellations but rather 
to provide a better understanding about the error probability calculation and the 
evaluation of the rate supported by constellations. 
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The paper is organized as follows. First, square constellations are considered in 
section 2. An optimal bits-to-symbol assignment (2D Gray mapping) is presented 
which minimizes the bit error probability on AWGN channels. А fast detection algo- 
rithm is discussed which reduces the implementation complexity of uncoded QAM 
systems, particularly for large signal sets. Digital signaling methods using 2D general- 
ized cross constellations (especially those with quadrilateral symmetry) are discussed 
in section 3. Both the average and peak power requirements of such constellations are 
evaluated. Bounds for the symbol error probability in the presence of AWGN are 
given. The opportunistic secondary channel is discussed in section 4. It is shown how 
to employ generalized QAM for transmitting a non-integral number of bits per two- 
dimension signal. These signaling schemes based on 2D generalized constellations are 
compared with multidimensional generalized constellations. The paper ends, in section 
5, with concluding remarks. 


11.1.2. A FAST DETECTION ALGORITHM FOR SQUARE QAM CONSTELLATIONS 


In this section, we present a particular assignment, to be referred to as "2D Gray 
mapping", which is optimum in the sense that it results in a minimum bit error proba- 
bility over the Gaussian channel. 

It is well-known that no bits-to-symbol assignment exists such that a one-to-one 
correspondence between the Hamming (HD) and squared Euclidean distances (ED) 
results, except for 2- or 4-point constellations. Nevertheless, in the case of some par- 
ticular constellations we can design a mapping where the minimum ED increases as 
the HD increases (the key word here is minimum). Figure 1 below exhibits such a 
mapping. 

A (4M)-point constellation is generated iteratively from an M-point one by substi- 
tuting the points of the latter for a square constellation, to be referred to simply as a 
Square. The initial constellation is the square whose points are labelled according to 
figure la. The process of iteratively labelling the points of the (4M)-point constellation 
is described as follows. 


The first 1062 М bits which label all the points of a given square are identical to 
the label of the point of the M-constellation it replaces. Now, the last two bits of the 
labels are assigned to the 4 points of each square according to one of the 8 equivalent 
Gray codings of a square, one of which is illustrated in figure 1a. The choice of the 
particular Gray coding used for a given square is such that each point bears the same 
last-2-bit label as its closest neighbour belonging to another square. Therefore, the 
Gray patterns chosen to determine the last two bits are symmetric with respect to the 
boundaries of the squares. Clearly, 4 different Gray patterns are used, depending on 
the labelling of the initial 4-point constellation: the initial pattern, the two ones which 
result from it by symmetry with respect to the x- and the y-axes, and the one resulting 
from the product of the two symmetries i.e., the original pattern rotated by x. 
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If the Gray number пс is defined as the average number of erroneous bits рег 
erroneous symbol [7], assuming only errors in favour of the closest points, it is 
apparent that ng = 1 for these assignments (compare this with CCITT recommendation 
V32 [8]). 

Let b and b’ be two binary words (labels) assigned to the signal points P and Р”, 
respectively. Let dy (resp. dg) denote the Hamming (resp. Euclidean) distance. Then, 
the two measures HD and ED are related according to the following inequalities: 


dg (P,P ') 2 Vido 


dy(b,b’)= 1 (i 
dy(b,b’) = 2 dp(P,P’)2 V2do 
If dy(b,b’)=3 then dg (P,P’)2 V5do (3) 
dy (b,b’)= 4 dp(P,P’)2 VB do 
etc m Tete 


where dy is the minimum Euclidean distance between two constellation points. 


It can readily be seen that the most likely error patterns result in less faulty 
detected bits than any other bits-to-symbol assignment, and consequently that the bit 
error probability is minimized (we assume maximum likelihood detection and equally 
likely symbols). Applications involving coding are beyond the scope of this paper and 
will be reported elsewhere. In the following, we propose a straightforward way to 
carry out the mapping/demapping in practical implementations. The bits-to-symbol 
conversion (and vice-versa) is performed with the help of several coordinate systems 
as indicated in figure 2. These coordinate systems clearly are symmetric with respect 
to each other as already discussed for the "squares" which enable to construct a (4M)- 
point constellation from an M-point one, as discussed at the beginning of Section 2. 


In many instances, it will be necessary to employ a coordinatewise vector product 
denoted by * and defined to be 


А 
Py*P2=(x1x2,y1Y2) where Р; = (х,у) є R?i=1,2. (4) 
Bits-to-symbol mapping 


Let us consider an M = 2"-point (m even) two-dimensional square constellation. 
А binary word b of length т is assigned to each signal point as indicated in figure 1. 
lnitially, each two consecutive bits are coupled as a 2-dimensional vector 
bj = (bi1,bj2), defining m/2 vectors in such a way that the binary word b can be writ- 
ten as 


b = (bmn-1 > Әт/2-2» --, b1 , Do). (5) 


The conversion of the binary information into a signal point can be made according to 
the following procedure: 
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step 1: Generate a new word B by replacing 075 by –1 in b, thus defining 


В = (Bmn-1 > Ban-2 » =» B1 » Bo). © 
step 2: The constellation point is given by 
P = Bpm2-1 IRA see Втр-17В8, 0-25. B 2! + Bm12-1 *.*B*Bo 2. (7) 


where * denotes the vector product introduced in (4). 


In order to illustrate this method, we shall consider the M = 64-point 2D constel- 
lation represented in figure 1c. As an example, let us find the constellation point P 
assigned to a given binary word, say (100011): 


ме have B=(1-1 -1-1 1 1)2(B2, B1, Bo) so that 
Р = By 2? + Bj*By 2! + By*By*Bo 2 = (4,4) + (2,2) + (-1,1) = (1,-1). 


The interpretation of this assignment method is quite simple. The first two bits (10) 
select the IV-th quadrant of the 64-point constellation so it is reduced to a 16-point 
one with its origin displaced to the (4,4) point. The next two bits (00) select the II- 
rd quadrant in the latter constellation, so it is reduced to a 4-point constellation with 
its origin displaced from (-2,2) with respect to the (4,4) point. This means that the 
origin was now moved to the point (-2,-2). Lastly, the bits (11) select the I-st qua- 
drant, і.е., the (1,-1) signal point. 


Symbol-to-bits demapping 


Let sgn(.) be an operator defined over R? which indicates only the sign of the 
two coordinates, that is, 
А 
sgn(P;) = (sgn ху, sgn y), given P; = (х,у) е R?. (8) 
In this section, B; will denote the 2-dimensional vector obtained by 
Bj = sgn(P;). (9) 
Before we start describing the demapping algorithm, we find it convenient to introduce 
m/2 special points defined by: 
A 
C; = 2i(1,1} for i = 0,1,2,...,m/2-1. (10) 


These points are shown in the constellation drawn in figure 2. 


Let P be the received noisy vector. A fast detection can be performed by the fol- 
lowing algorithm: 


set i=m/2-1, P;=P (initial conditions) 
step 1: B; = sgn(P;); 

if i = 0, then stop detection. 
бер2: Pi -В/Р;-Сы; 
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і = і-1; 
go to step 1. 


The detected binary word b is the one which corresponds to В. 


An advantage of this technique in recovering digital information is that it does 
not require look-up tables. It is also interesting to mention that step 1 runs exactly m/2 
times and that a partial detection of two bits occurs at each run. This implies that the 
information can be delivered to the sink (destination) before the end of the overall 
detection process, which can be advantageous for some very high-speed applications. 

Once again we present an illustrative example using the constellation represented 
in figure 1c. Assuming that the received vector is P - (-3.2, 4.9), the algorithm above 
results in : 


Рз = (3.2, 4.9) Вз = (-1, 1) 
P, = (-0.8, 0.9) therefore Ву = (-1, 1) 
Ро = (-1.2,-1.1) Во = (-1,-1) 


Thus В = (-11 —11 -1-1) and the detected binary sequence is (010100), which is the 
constellation point closest to P. One can easily find the pair of axes in figure 2 which 
is the coordinate system relevant to the points P;. Finally, the following comment 
may be useful. In cases where one wishes to use a constellation with a minimum dis- 
tance between points do (do + 2), it suffices to scale both the transmitted vector Р 
and the received one P „2-1 by a factor 40/2. 


П.1.3. PERFORMANCE OF GENERALIZED CROSS CONSTELLATIONS 


Let us consider the use of some multiple signal phase-amplitude schemes over an 
AWGN channel. It is established [9] that uncoded QAM performance with rectangular 
constellations is given by 


x 1 4 | 5w || 
Р,(2)м = 1- h- yo | es] , (11) 
where 


P.(2)y is the error probability per 2D symbol, 
M = 2" is the number of signal points, m even, and 
Yav = Eav/No is the signal-to-noise ratio, E yy being the average energy per 2D symbol. 


Accordingly, Yay represents the ratio of the average energy to the noise spectral 
density, both per 2D. Dividing both the numerator and denominator by two results in 
the same ratio per dimension: Yay = 2Ey/N y, where Ey = E,,/2 is the average energy 
per dimension. Thus, Yay is expressed in [Watts.s/dim]/[(Watts/Hz)dim], so it is a 
dimensionless quantity. Moreover, assuming a signaling rate of 2B dim/s we find this 
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is equivalent to the ratio S/N usually found in the capacity formula. We claim this 
SNR measure is more suitable for channels in the bandwidth-limited region than 
E,/No which is more interesting for channels in the power-limited region. 


Of course, we may neglect 1/ŸM if M is large enough, yielding 


3 
P.(2)m S1- [I-erfcN SIT y, (12) 


where the bound gets tighter and tighter as M increases. 


Forney and Wei defined the figure of merit of a constellation C [10] as: 
2 2. 





А 
CFM (С) = : (13) 


mm. 
P(C)' 
where P (C) is the average power of C. Instead, we think it is a bit more convenient 
to use 





a а2,/4 2 
= mn’ _ Pp 
FM(C)= PO FO (14) 


which is the same except for a scale factor. For example, a QAM system with a square 
M-point constellation has СЕМ(С)-6(М-1) (cf. [10] p.879) while 
ЕМ (С) = 3/[2(M-—1)]. The latter is exactly the multiplying factor for Yay in the error 
probability expressions. As a matter of fact, all the expressions and/or bounds on the 
error probability over an AWGN channel (coded or uncoded systems) can be expressed 


TC Additionally, this little modification does not change the 
asymptotic gain formula when coded constellations are used, since 


_ СЕМ(Сым _ FM(Cooë _ (džin) P (С) is 
ur? = CEM (Ce FM (Che (ше Р (Ced 


as functions of 


as usual in coded-modulation. 

We think this figure of merit is more natural. Moreover, it can also be extended 
to lattice coded systems [11]. So, we prefer to consider normalized constellations with 
respect to d min = 2 whereas Forney and Wei use d min = 1 as normalized value (our 
choice corresponds to p = 1 in lattice terminology). Hence, the normalized average 
power values printed in our tables have been calculated for constellations where d gis 
= 2, i.e., the signal points were taken in an odd-integer 2Z? + (1,1) lattice. 

Ordinarily, the performance of QAM systems is analysed at high signal-to-noise 
ratios (Yav > 2(M –1)/3), in which case a reasonable approximation of the symbol error 


rate is 
3n. 
P. = 2erfe(N zB) = expl-FM (C) Yel (16) 


Let us now introduce a family of least-energy constellations, namely generalized cross 
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constellation, respecting a perfect quadrilateral symmetry and constrained to the fact 
that all their points belong to the odd-integer grid. Figure 3 shows some of these con- 
stellations. It can be noticed that all (2k)?-point constellations are square signal sets. 


Generally, a signal set is expressed by: 
550) = Ас u(r) cosQxf.r) - Ау u(t) sinQnfar) ј = 1,2,....M, (17) 


where u(t) is a narrow-band waveform, 

(Acj.Asj) are coordinates in the 2D constellation, 

and f. is the carrier frequency. 
Assuming a signaling rate of 1/Т bauds, an information symbol is transmitted each T 
seconds and the QAM signal s(t) is given by 


S(t) = Y aek u(t-kT) cos2nf.t) - Y ask u (t-kT) sin(2rfct), (18) 
% k 


where (ac,,as,) corresponds to the k-th transmitted signal (Acj(,A5j(u)). 
The signal s (t) can also be written in terms of its complex envelope: 
s(t)=Re Y, P, u(t-kT) exp 2nfet), (19) 
k 


А 
where the complex Pg = ас + j аҙ represents a constellation point. 

Each signal s;(t) is associated with a 2D point Р; = Aj + ЈА, = (Acj, Aj). The 
energy of a constellation point is |Р; P? = А2, + А? and the average energy per 2D- 
point is E(C) = E (|P j|?) = E (42 + А2). The average energy E (C) is often expressed 
as a normalized power P (C) i.e., T has been normalized to unity so both terms are 
considered interchangeable. 

It is supposed that the signals on phase and quadrature carriers can perfectly be 
separated by coherent detection, and that maximum likelihood detection is carried out 
by the receiver. 

Let P,(i-th D) denote the probability of an erroneous decision in the i-th dimen- 
sion, i = 1, 2. For simplicity, we shall consider constellations with quadrilateral sym- 
metry and furthermore such that 


А 
P,(1-st D) = P,(2-nd D) = Р,(1)м, (20) 
where P,(1) is the error probability per dimension for the M-ary QAM system. Gen- 


erally, detection must take account of all the signal dimensions because there is some 
dependence between signal coordinates (except for square constellations). 


Let P,(1|P;) denote the conditional probability of an erroneous decision per 
dimension given that the signal point P; was transmitted. Obviously, Р,(1)м can be 
evaluated as: Е 

MA 
PD = Y, PC) PAP», (21) 
i 


where P(P;) is the probability of P; to be sent. 
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In an unbounded constellation, all the signal points have the same decision region 
so P,(1|P;) does not depend on the taken point, that is, P,(1|P;) = ре. Substituting 
this in (21), it follows that P,(1)=p, for the boundless constellation (M 99). For 
bounded constellations, this is an upper bound on the one dimensional error rate (since 
P,(1|P;) S pe), that is 


Pem < PL). = pe. (22) 


Likewise, the 2D error rate (symbol error probability), P,(2)y, is also upper bounded 
by the symbol error probability for the unbounded constellation. In this case, all points 
have identical Voronoi regions so that 


Р,(2)м € Р,(2).. = 1 - [1-p,]? (23) 


since the noises added to both components are statistically independent. Therefore, the 
error rate of such a signal set is essentially controlled by pe. 

We shall now investigate the error probability per dimension in an unbounded 
constellation over an ideal band-limited AWGN channel. 


THEOREM 1. 

The one-dimension error probability p¿ of M-ary QAM systems based on 2D general- 
ized uncoded constellations (border effect neglected) over an AWGN channel is given 
by pe -еге(УЕМ(Су,) M 

proof. 

The proof is straightforward and is based on a number of known results. 


4 * 
Defining the symbol autocorrelation function as Ар(/) = E(P; P¿-¡), it can be 
shown that the spectral power density of the signal s(t) is given by (provided the qua- 
drilateral symmetry): 


5,07) = : 


4T 
where U(f) is the Fourier transform of u(t) introduced in (18). Of course, 
Ер(0) = E (JP ¡[?) = E(C). 

The average power P „w of the QAM signal is found by integrating (24), that is, 


pem 
Py=2O | queso? + uef- af = Оқ, Q5) 


Rp() (UE -fD + |U Cf 0121, (24) 


4T 2T 
+оо 


+00 
where €, = | luc)? de = | |U(f)|* df is the energy of the narrow-band pulse и (t). 


— e. 


Hence, the average energy of the QAM signal is 


Ew =P y T = E(C)E,/2. (26) 
As explained above, we are interested in the signal-to-noise ratio 
2Еу En 
=— = ---. 27 
Yav No P (C) 2No (27) 
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We shall use the pass-band representation [12] of the random noise signal n,(r) in a 
bandwidth B Hz. The noise is assumed to be white with spectral power density 


No/2 . 
sm o Шы ақ 


The narrow-band noise waveform can be expressed as: 
n,(t) = no(t) cosQnf.t) — п,() sinQnf.t), (29) 


where no(t) and n,(r) are both low-pass noise signals band-limited to B/2 having as 
power spectral density 


поно [0 Wins a» 
Since the noise is assumed to be additive, the received signal is s (1) + n, (r) where the 
signal and the noise are given by (18) and (29), respectively. The received waveform 
is then processed: a coherent detection is performed followed by matched filtering and 
decision-making. 

In order to achieve the maximum transmission rate we need use the fastest sig- 
naling rate. We know the bound 2B dim/s on the number of dimension per second 
accommodated by a band-limited channel [2]. In the case of 2D constellations, a sym- 
bol corresponds to 2 dimensions so the transmission speed must be less than B bauds 
- B symbol per second. 

On the other hand, Nyquist's criterion asserts that a bandwidth 1/2T (base band) 
or l/T (bandpass) is the minimum bandwidth needed for transmitting without inter- 
symbol interference (ISI) at a rate 1/T symbol per second. These two approaches 
confirm that T — 1/B represents the minimum interval where we can transmit without 
intersymbol interference on a band-limited channel of bandwidth B Hz. 


The equivalent low-pass signals at the receiver can be written as 


rc(t) = Y, ack UAT) + no(t) (31.а) 
k 

rs(t) = У ag UT) + ng(t). (31.b) 
k 


Hereafter, the index c or s will be dropped because the signal detection is identical in 
both the quadrature and phase components. We write simply: 


r (tr) = Y ay u(t-kT) + n(t). (32) 
k 
The impulse response of the matched filter is A(t) = и* (t), so that its output is 
+оо + + 
уб) = Jr(@)h(t—-o) da = y a, | u(o-kT)u*(a-1) da + | n (094 (a-t) da. (33) 
-<о k oo —oo 


The output of the matched filter at the sampling instant nT is the decision variable y,: 
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Yn = Y ay fu(o-KT) и" (апт) da + [ n(o) u'(a-nT) do. (34) 
k — €: 


It is known [12] that the response of a linear filter to a random Gaussian process is a 
Gaussian random variable, so 


^ + 
Wn = ]n(m)u'(a-nT)da = N(0,Noëu). (35) 


А 
On the other hand, defining p (t) = u(t) . и (-ғ), it follows that 
Ya = Gp(0) + Y ak p(nT—T) + wy. (36) 
k, ken 


The first term is the desired signal while the second and the third ones represent the 
intersymbol interference and additive Gaussian noise, respectively. 


We assume и (г) real and such that the waveform p (t) obeys the first Nyquist cri- 
terion so the ISI vanishes. Therefore, we meet here the well known equally split filter- 
ing between the transmitter and the receiver. 


Finally, we have 
Yn = Anbu + Wn. (37) 


^ 
Alternatively, we can consider a "normalized" decision value Y, = a, + W,, where 
Wao М(0, 0? = No/E,). It is trivially verified that the one-dimensional error probabil- 
ity pg is 


22.74 
Pe = erfc 52 ). (38) 





Keeping Forney's notation, we rewrite (38) as 


De = erfc(V(d2in/4)Yav/P (C)) = erfc(NFM (Суү,, ), (39) 
QED. E 


A more accurate estimate of the error probability must take into account the bounded- 
ness of the constellation. The exact performance calculation is complicated due to the 
shape of Voronoi regions concerning the outmost points. The reduction in the estimate 
of P,(2)y depends on the number of outmost points and can be obtained as follows: 


THEOREM 2 

The performance of M-ary QAM systems with symmetrical generalized cross constel- 
lations satisfies the bounds 1-[1-2ozpe + Brp2] S P.(2 < 1-[1-2aype + Bup?], 
where p, is the one-dimensional error probability given by Theorem 1 and о, В are 
real numbers (less than unity) defined below. B 

proof. 
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Let T; (resp. Го ) be the set of all inner (resp. outer) points and let || denote the car- 
dinality of the set Г. Two kinds of outmost points, namely type I and type П, can be 
considered. First, the points that are outmost regarding just one dimension, and 
secondly those which are outmost regarding both dimensions. Consequently the set of 
outmost points, Го, can be partitioned into two disjoint subsets, Th ( TË. 

Moreover, we notice the presence of a few ill-defined inner points occurring in 
the [Qk)?-4]-point constellations, but we neglect it in this analysis. 

We shall suppose henceforth, as usual, that all signal points are equally likely a 
priori. Thus: P (T) = |Г|/М. Certainly |T;|-|To | = M, so that P (Гу) + P (Го) = 1. 

In order to circumvent the difficulty associated with the dependence between sig- 
nal coordinates, we have bounded the error rate by taking rectangular decision regions 
different from the Voronoi regions. The following relations are then established: 


Р.СІР ГИ) = 1-177. (40.2) 
1-[1-pe] . [1254/2] S P.(2|P;eT 0) <1-П-р.Р (40.b) 
1-[1-p,/2}* < P,Q|P;e TB) <1-П-р.1.П-р:/21. (40.c) 
The symbol error probability of QAM systems can clearly be written as: 
Р,(2)м = Y P(P;) Pe(2|Pi) + (41) 
Piel, 
+ E PO) PIP) + Уу PE) PP). 
Pie o Pele 


Applying relations (40) to the equation above, the following bound is obtained: 
Р,(2)м 2 1- [PT )) [1-pe]? + POO) [1-pe] [1-pe/2] + POS) (1-ре/212] (42) 
which after some computation yields the lower bound: 
P,(2 2 1- [1 – 20g pe + Brel, (43) 


where 0, = P(Tj) + 0.75 PT) + 0.5 PT 2) 
and = By = PT) + 0.5 PT D) + 0.25 PT) 


Furthermore, we have 
Pe(2)y < 1- [T7 1-р]? + POO) [1-pe]? + POS) [1-pe] [1-pe/2I], (4) 
yielding the following upper bound: 
P.(2)y S 1- [1 - 2aype + Bup?], (45) 


where au = Р(Гу) + Р(Го) + 0.75 574 
and Bu=P(T;)+PTb)+0.5 PT). QED. Ш 

It can be seen that M approaching infinity (ie., ап unbounded constellation) 
implies оу, Ay — 1 and Br, By 1, so that the upper and lower bounds agree and 
P, (2) reduces to (23) as expected. Futhermore, an M = 27-роіпі (т even) rectangular 
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constellation can be found for which 
pr Jee PT) =1- 4 m-n and PT) = 4 (M2) so that ay = B2 = 


1- т and the lower bound is reached (see (11)). 


It can be conjectured that the symbol error probability of any 2D cross constella- 
tion is well fitted by a curve P,(2), = 1 - [1-20p,+fp£] for some о, В both less 
than, but close to, unity. 


The performance evaluation of generalized cross constellations by Theorem 1 or 2 
needs the normalized average power P (C) of the constellations. These values are 
presented in table II where the average power is also expressed in dB. Values of the 
peak-to-average power ratio PAR are also available. For comparison purpose, the aver- 
age power of minimum energy constellations constrained to the fact that all points 
belong to the odd-integer 2Z?+ (1,1) lattice is also included. Indeed, cross constella- 
tions are not always optimal, but they are attractive at least from a theoretical 
viewpoint. Constellations of minimum energy have normalized power denoted by 
P (C)mm which is easily computed by taking the M least-energy points in Table I. 


TABLE I. 
Energy Distribution in the 22? + (1,1) lattice. 


Shell | №. of points ET Ike | Energy per 2D | 


1 
2 
3 
4 
5 
6 
7 
8 
9 
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TABLE II. 
Parameters of some Generalized Cross Constellations. 


2.0000 1.0000 2.0000 

10.0000 10.0000 1.0000 6.0000 7.1815 

7.3333 8.6530 1.3636 7,3333 8.6530 
10.0000 10.0000 1.8000 10.0000 10.0000 
14.8000 11.7026 1.7567 13.2000 11.2057 
15.3333 11.8564 1.6956 15.3333 11.8564 
20.2857 13.0719 1.6760 18.0000 12.5527 
20.0000 13.0103 1.7000 20.0000 13.0103 
23.3333 13.6798 2.1428 23.3333 13.6798 
26.0000 14.1497 1.9230 26.0000 14.1497 
28.1818 14.4997 1.7741 28.1818 14.4997 
31.3333 14.9601 1.8510 30.6666 14.8667 
32.7692 15.1547 1.7699 32.7692 15.1547 
37.4285 15.7320 1.9770 35.7143 15.5284 
38.2666 15,8282 1.9337 38.2666 15.8282 
42.0000 16.2325 2.3333 41.0000 16.1278 
43.4117 16.3761 1.8888 43.4118 16.3761 
46.4444 16.6693 2.1100 46.0000 16.6276 
48.3157 16.8409 1.8627 48.3158 16.8409 
50.8000 17.0586 1.9291 50.8000 17.0586 
53.8095 17.3086 1.9699 53.4286 172771 
55.8181 17.4678 1.8990 55.8181 17.4678 
60.4347 17.8129 2.1510 58.6957 17.6861 
62.0000 17.9239 2.0967 61.3333 17.8770 
66.0000 18.1954 2.4545 64.0800 18.0672 
66.6153 18.2357 1.9515 66.6154 18.2357 
70.1481 18.4602 2.3093 68.9630 18.3862 
71.1428 18.5213 1.8273 71.1429 18.5213 
74.2158 18.7085 2.1810 73.7241 18.6761 
76.1333 18.8157. 1.9176 76.1333 18.8157 
78.9032 18.9709 2.0531 78.9032 18.9709 
82.0000 19.1381 2.0731 81.7500 19.1249 
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84.4242 
89.0588 
91.1428 
95.3333 
95.4054 
99.2631 
99.6410 
103.200 
104.243 
107.523 
109.534 
112.545 
115.777 
118.521 
123.191 
125.666 
130.000 
129.680 
133.764 
133.692 
137.547 
138.000 
141.636 
142.857 
146.280 
148482 
151.694 
155.066 
158.065 
162.774 
165.555 
170.000 


TABLE П. (Continued) 


19.2647 
19.4968 
19.5972 
19.7924 
19.7957 
19.9679 
19.9844 
20.1368 
20.1805 
20.3150 
20.3955 
20.5133 
20.6363 
20.7380 
20.9058 
20.9922 
21.1394 
21.1287 
21.2634 
21.2611 
21.3845 
21.3988 
21.5117 
21.5490 
21.6519 
21.7168 
21.8097 
21.9052 
21.9884 
22.1159 
22.1894 
22.3045 


84.4242 
86.9412 
89.3143 
91.7777 
94.1081 
96.7368 
99.2308 
101.800 
104.244 
106.952 
109.535 
112.182 
114,711 
117.304 
119.787 
122.333 
124.939 
127.440 
129.843 
132.154 
134.830 
137.407 
140.182 
142.857 
145.439 
147.931 
150.475 
152.933 
155.443 
157.871 
160.349 
162.750 


19.2647 
19.3923 
19.5092 
19.6274 
19.7363 
19.8559 
19.9665 
20.0775 
20.1805 
20.2919 
20.3955 
20.4992 
20.5961 
20.6931 
20.7841 
20.8754 
20.9670 
21.0531 
21.1342 
21.2108 
21.2979 
21.3801 
21.4669 
21.5490 
21.6268 
21.7006 
21.7746 
21.8450 
21.9157 
21.9830 
22.0507 
22.1152 
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In order to check the validity of our results, the performance of a 12-ary QAM 
system in the presence of AWGN (generated by the polar method [13]) was evaluated 
by Monte Carlo simulation. Figure 4 represents computer simulation results of the 
symbol error probability versus signal-to-noise ratio. The least square regression 
analysis shows that the symbol error rate fits the 1 — [1 — 2 0.706p, + 0.475p;] curve 
with a correlation coefficient ғ = 0.999 and a standard error of estimation 5 = 0.013 for 
n = 18 data points. The upper and lower bounds were also drawn for comparison 
(solid lines). It can be seen that the simulated performance closely agrees with the 
results predicted from Theorem 2. 


Finally, we apply these bounds as to evaluate the performance of conventional cross 
constellation, namely 32-QAM and 128-QAM. Results are presented in table III. 


TABLE III. 
Error Performance of 32-QAM and 128-QAM Uncoded Signaling Schemes. 


2 парз oses | 09375 08780 
vs із 08281 | 09845 09687 





11.14. OPPORTUNISTIC SECONDARY CHANNEL 


The generalized cross constellations described in the previous section can be 
regarded as a way to convey a non-integral number of bits per symbol (or bits per 
2D). In a recent paper [10], Forney and Wei discussed the use of generalized multidi- 
mensional constellations and their ability of supporting an opportunistic secondary 
channel. In earlier applications, this technique was conceived as a means to create an 
opportunity to transmit additional side information (like internal signaling and control 
data) [14]. More generally, it can be used for increasing the information bit rate by a 
small fractional number, i.e., as a way to introduce an additional rate in generalized 
constellations. We intend here to make a precise estimate of this potential additional 
normalized rate. 

Given an M-point cross constellation, a starting (or basic) constellation is defined 
to be the largest 2"-point constellation with size smaller than M. For the sake of sim- 
plicity, we show as an example the 7-point constellation drawn in figure 5. The 
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starting constellation (shaded points) has only 4 points like fig.la. Each new additional 
point is associated with a point in the basic constellation in such a way that both have 
the same label. An opportunistic bit (written into brackets in fig.7) is appended which 
takes value 0 or 1 according to whether it belongs or not to the starting constellation, 
respectively. 

We say that the direct channel was used when the label of the transmitted signal 
point have no opportunistic bit, otherwise we say that the opportunistic channel was 
selected. In figure 5, assuming the source bits to be equally likely, we have 

P(select opportunistic channel) = Р((00,01,11)) = 3/4, 
P(select direct channel) = P({10}) = 1/4. 

In cases where the direct channel is employed, only 2 information bits are 
transmitted while 3 information bits are conveyed when the opportunistic channel is 
selected. Thus, the average transmitted number of information bits per two-dimension 


is B= i2 * 23 = 2.75 615/20. This process can be generalized as follows. Let us 


such that 2” < M <2"+1, It can be readily verified that m = |log?M| is such an 


integer, where the floor function Lx] denotes the largest integer no greater than x, as 
usual. Of course, an integer W exists, O < W < 2", such that 


M = 2" + №. (46) 


Here, W represents the number of points appended to the basic constellation. In the 
following, we generalize the use of (һе opportunistic secondary channel by the same 
reasoning as in the previous example. Ап amount of m bits are transmitted per symbol 
(2D) when the direct channel is used. In contrast, m + 1 bits (per 2D) are transmitted 
when the opportunistic secondary channel is selected. 

Let Рос and Рос be the probability of selecting the direct channel and the 
opportunistic channel, respectively. The average transmission rate (in information bits 
per 2D) is given by 


denote by M the number of points in a 2D cross constellation. lo m l an integer 





p = Ррс m + Рос (т+1) bits/2D. (47) 
For equally likely source bits, it follows that 
27-W W W 
В = zm .m TU wr emt (48) 
m-1 
Since 0 S W < 2", we can use the binary decomposition to write W = Y d;2'. Using 
i=0 
Forney and Wei's notation, the normalized rate D in bits per 2-dimension is 
Ld d;2i 
Le 49) 
іо 2 


А 
where we have defined dm = m. 
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Now, we shall investigate an explicit relationship between the normalized bit rate 
B and the constellation size M. To begin with, let us consider a new function (log)? to 
be referred to as rational logarithm and defined for any positive integer M by 


M 


(log) M = вам) + sal : (50) 


Combining equations (48) and (46) and remembering that m = |logaM ЈА it fol- 
lows that 
В = (log)}M. (51) 


Bounds оп the (log)} function are given by the following theorem: 


THEOREM 3. 
For any integer M > 0, the (log)} function verifies: 


[toga < (log)$M < оғ; М, (52) 


with equality iff M = 2" for some integer т. Ш 
proof. 
The proof of the lower bound in (52) is immediate: we have 


M 1 log;/M- lien | 


(log M — [toga = “ый” -2 -1>0. (53) 
2 


The upper bound сап be proved in the following way: we сап write from the (lop? 
definition: 


log;M – |1og;M 
log;M — (log)}M = log;M- |вем| +1-2” pos | (54) 
On the other hand, one has |ем| < logM < logon] so that 
0 < log; M — logs | < 1. (55) 


4 

Let us deal with the real function f (х) 2 x-1—2* -co< x <+ which satisfies the 
property: 

f(x)20 for OSx <1. (56) 

Therefore, taking x = log.M - log], the claimed inequality logzM - (log))M 20 


follows from (56) and (54). At last, we mention it is trivial to verify the conditions 
"iff" about equalities. Q.E.D. B 


We have evaluated the normalized rate B in bits/2D supported by the 2D signaling 
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schemes just described. А comparison between the multidimensional constellation 
schemes proposed by Forney and Wei (cf. [10], table II, p.891) and those suggested 
here is presented in Table IV. According to our point of view, an advantage of the 2D 
signaling schemes is to allow a more "realistic" comparison with the coded modulation 
Systems at fractional spectral efficiencies. We think this could be morc suitable than 
the baseline criterion proposed by Forney and Wei. Indeed, the practical applications 
are rather complicated owing to the problems caused by the variable length of the 
transmitted binary word in this kind of signaling systems [14]. 


TABLE IV. 
Comparison between 2D and Multidimensional Uncoded Signaling Schemes. 


2D Generalized Constellations | Multidimensional Constellations 


N PC) dB PAR | |С N PC) dB 





11.15. CONCLUDING REMARKS 


We presented an attractive mapping for rectangular constellations as well as a fast 
detection algorithm which seems to be interesting for practical implementation of 
QAM at high-speed data transmission. In particular, it would be of interest to high- 
capacity digital microwave radio systems. We obtained also upper and lower bounds 
of the symbol error probability for 2D generalized cross constellations in the presence 
of band-limited AWGN, and in -particular, for conventional cross constellations 
(M = 2", m odd). The ability of 2D cross constellations in transmitting fractional rates 
was investigated making use of the opportunistic secondary channel. A closed-form 
expression of the normalized rate (in bits per 2D) as a function of the constellation 
size was obtained. These signaling schemes are suggested as a reference for perfor- 
mance comparison in coded-modulation systems with fractional normalized rates. 
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Fig. 1b. 


9 
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-7 a в в s . в . . 





Fig. 1c. 


Figure 1. This figure illustrates the iterative construction and bits-to-symbol assignements 
of a (4M)-point constellation from an M-point one. Figure la is the starting 4-point 
constellation with Gray coding bits-to-symbol assignment. The 16-point constellation of 
figure 1b results from replacing each point of the previous one by a 4-point constellation; 
the bits-to-symbol assignment used is described in the text. The next step of this process 
i.e., the 64-point constellation, is illustrated in figure 1с. 
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Figure 2. Coordinate systems which are used for both the bits-to-symbol conversion 
and the fast detection of received data when square constellations and bits-to-symbol 


assignement of figure 1 are used. 
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Figure 3g. 


Figure 3. Generalized cross constellations with quadrilateral symmetry. Their sizes are 4 
(За), 8 (3b), 12 (3c), 16 (3d), 24 (Зе), 28 (3f), and 36 (3g). 
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Figure 4. Bounds on the symbol error probability for a 12-point constellation and the 


corresponding simulated error rate. 
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Figure 5. 7-point generalized constellation with opportunistic channel. The starting 
(or basic) constellation is the square 4-point one with shaded points. 3 more points are 


appended to 3 of its points. A third "opportunistic" bit (in brackets) is appended to their 


labels to tell whether the corresponding point belongs or not to the starting constellation. 
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Figure 6. Rational log function and its relation with the log function. 
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П.2. PROBLEMES LIES A LA RECUPERATION DE PORTEUSE ( МСТ): 


MODULATION DIFFERENTIELLEMENT COHERENTE. 


Les problèmes de synchronisation constituent un chapitre intéressant de 
l'étude de la modulation codée. La récupération de la fréquence de rythme peut être 
réalisée de manière classique, mais la récupération de porteuse pose quelques problèmes. 
Ungerboeck [UNG 1982] observa que l'expansion de l'alphabet rend le jeu de signaux plus 
sensible aux erreurs de phase. Il remarqua, pour la MDP codée, l'existence d'un seuil de 
l'écart de phase au delà duquel les décisions du décodeur cessent d'étre corrélées avec les 
signaux reçus; c'est alors le bruit qui pilote la boucle de récupération de la porteuse. 
Quoique le système puisse finir par se resynchroniser, ce comportement peut durer un 
certain temps. En outre, la détection cohérente est trés difficile à mettre en œuvre dans 
bien des cas, tels que la communication radio mobile. 


Lorenzelli et al. ont étudié les effets d'une synchronisation imparfaite de 
phase sur les systèmes MDP 4 non codée et MDP 8 codée en treillis [LOR ег al. 1987]. Un 
systéme ой la phase est récupérée à l'aide d'une horloge est analysé et comparé avec la 
récupération de porteuse par des circuits de multiplication de fréquence. Un algorithme 
séquentiel pour la détection différentielle de systèmes de МСТ sur une modulation MDP 
est proposé par Makrakis et Feher [MAK&FEH 1988]. 


Edbauer considère l'application de la modulation codée aux canaux avec 
évanouissement. Il propose l'adaptation du décodage différentiellement cohérent à un 
code en treillis en construisant un code MCT sur une modulation différentielle 8 DMDP 
avec entrelacement [EDB 1987, EDB 19892, EDB 1989b]. 


McLane et collaborateurs ont étudié une combinaison de codes en treillis avec 
une modulation différentielle par déplacement de phase (DMDP), dans le cadre du 
programme canadien de communications mobile par sattelite [McL er al. 1988]. Le 
systéme travaille sur un canal à évanouissement de Rice et est essentiellement congu pour 
la transmission de la voix, et des taux d'erreur de l'ordre de 10? suffisent à cette 
application. 


Torck, Kawas-Kaleh et collaborateurs ont récemment abordé le décodage et 
l'estimation de phase conjoints pour la modulation codée, à l'aide d'une version modifiée 
de l’algorithme de Viterbi [TOR et al. 1991]. 
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Le probléme de la récupération de porteuse en présence de gigue de phase et 
d'écart de fréquence dans les systèmes de modulation МАО à haute efficacité (> 6 
bits/s/Hz) a été considéré par Cupo et Gitlin [CUP&GIT 1989). Ils proposent un système 
adaptatif où la boucle d'asservissement qui commande l’oscillateur local utilise des filtres 
à réponse impulsive finie (RIF) ou infinie (RII), ce qui améliore la fiabilité de 1а réception 
par rapport aux boucles à verrouillage de phase classiques. Ces structures évitent 
l'antagonisme, inhérent à la plupart des boucles de récupération de porteuse, entre 
l'élargisseement de la bande (favorable à la poursuite rapide de la phase) et son 
rétrécissement (pour minimiser le bruit à la sortie). 


Nous avons abordé ici les performances de la modulation codée en treillis en 
présence d'un écart de phase. Nous nous sommes intéressé particuliérement aux 
problèmes de synchronisation de phase de la porteuse quand l'oscillateur local présente 
un déphasage par rapport à l'oscillateur de l'émetteur. Kawas Kaleh a suggéré de 
combiner le décodage différentiellement cohérent avec la modulation codée, comme 
solution pratique au cas de canaux ой il est difficile de maintenir la cohérence de phase. 
L'introduction d'une phase aléatoire inconnue oblige à modifier la régle de décodage. On 
pourrait envisager, par exemple, d'utiliser encore l'algorithme de Viterbi [VIT 1967, 
VIT&OMU 1982], mais la distance euclidienne maximale cesse d’être le critère pertinent et 
le probléme du choix d'un code convenable se pose. 


Dans un premier temps, des constellations de signaux ayant tous la méme 
énergie, en particulier les signaux MDP codés, ont seules été envisagées. Comme on verra 
par la suite, le décodage non cohérent optimal conduit à une métrique non additive. La 
complexité, même dans les cas les plus simples, rend le décodage exhaustif pratiquement 
impossible. Une approximation intéressante a consisté à ne retenir qu'un seul terme de 
l'estimation de la phase. La régle de décodage obtenue dans ce cas est fonction d'une 
combinaison entre un symbole s, et-son prédécesseur 5ұ 1. Le train (sy) subit donc un 
traitement (codage différentiel) dont le résultat est un train (5%). En considérant la 
modulation différentielle comme une opération portant sur des symboles de canal 
complexes, on se ramène par un changement de variable à une règle de décision qui a la 
méme expression que dans le cas cohérent. On a donc fait l'hypothése que les suites de 
symboles apr?s codage différentiel 5”, devaient avoir la distance euclidienne libre la plus 
grande possible, c'est-à-dire que les suites (5%) doivent appartenir à un code 
d'Ungerboeck. 
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La conception du codeur devient trés simple si on l'envisage sous la forme 
d'un codeur d'Ungerboeck suivi d'un codeur différentiel inverse. Ce système a été 
simulé en Pascal sur le VAX, dans le cas d'un code d'Ungerboeck à 4 états, et les courbes 
du taux d'erreur en fonction du rapport signal-à-bruit ont été tracées. Le gain 
(asymptotique) du système différentiel MDP 8 codé par rapport au système différentiel 
MDP 4 non codé est d'environ 3 dB pour des rapports signal à bruit élevés. 


Mais les suites ainsi émises n'appartiennent pas à un code d'Ungerboeck et 
on peut chercher à concevoir un système en se donnant la contrainte que les suites émises 
appartiennent à un tel code. On aboutit alors à un code ой le nombre d'états est le double 
de celui du code d'Ungerboeck, par scission de chacun des nœuds du treillis. Ainsi, les 
treillis à 4 et 8 états correspondant aux MDP 8 / MCT à 2 et 4 états, respectivement, ont été 
trouvés. La structure de corps sur les symboles du canal joue dans cette procédure un rôle 
important et les codes convolutifs obtenus ne sont pas linéaires. La simulation du code à 
8 états a montré que les résultats étaient peu différents des précédents. 


Encore qu'il se justifie par un raisonnement séduisant, l'entrelacement 
s’avère trompeur. Du strict point de vue de la théorie de l'information, le bruit le plus 
nuisible est complètement aléatoire. Si le bruit possède une structure quelconque, elle 
peut être exploitée au bénéfice de l'information utile. Un entrelaceur s'efforce donc 
soigneusement de convertir un bruit peu nuisible en un autre qui l'est davantage! Bien 
qu'il s'agisse d'une technique erronée au niveau philosophique, elle est très utile dans 
toutes les applications pratiques. 


П.2.1. INTRODUCTION. 


The performance analyses of coded modulation schemes are often carried out under 
the assumption of coherent demodulation. However, a practical problem which occurs in 
digital communications is the difficulty to extract a good carrier reference from the 
received signal. Thus, trellis-coded modulation schemes - which are known to be very 
efficient - could be made more robust by providing a differentially coherent detection in 
order to suppress such a requirement of carrier recovery (Fig. 1). 
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Figure 1. Block diagram of TCM system with differential detection. 


Pe bit 


snr dB 





Figure 2. Sensitivity of bit error probability to carrier phase drift for 4-state 8 PSK/TCM 
Ungerboeck code. 


Let us assume a binary input (ay) applied to a 2"-state binary convolutional 
encoding (constraint lenght v+1) followed by a bits to symbol mapping (modulation). 


Of course, sj = Қақ,аұ 1,....8ру) and sy, = Қақ 1,аұ2,...,2ыү-1), SO that 
ж 
Sk S k-1 = F(ag, 8.13.2. 8k v1) 
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An approach to Trellis-Coded Modulation with differential detection could 
therefore be the following: the decoder could use a 2V* state trellis instead of the 2У- 
state onc needed in the coherent decoding owing to the correlation between consecutive 
channel symbols. This is equivalent, in some way, to enhance thc memory of thc 
encoder. We shall consider the project of such a trellis in the next section. 


П.2.2. DESIGN OF TRELLIS-CODED M-ary DPSK MODULATION. 


Let the channel symbols (phasor notation, j= V-1) be 
s.) = Уе), dG) € 6:-( ze ; 1=0,1,....2M-1), 


where Es is the energy per symbol and фу(і) is the phase. 
Whithout loss of generality, we shall consider normalized signals, that is V2Es=1. 


Тһе differential operation is represented by 
510) = skl) 5,10" = e KO e “IOk-10 = e OkO- Фк-10) where 40-41 14) е D. 

The differential encoding have some interesting properties. First, it does not 
change the shape of signals, that is, 5% (4) is a signal of the same kind as s,(i). Second, it 
is a reversible transformation in the sense that there exists an inverse operation such that, 
given a differentially coded sequence (s'(i)), it is possible to recover the corresponding 
sequence (5% (4)), provided there is no noise. 

It is straightforward to derive the sequence (sy(i)) from the sequence (6%(1)). Clearly, 
S,=S', Sy.) because 5% sy. =1. 


In view of the fact we consider an AWGN channel, it seems reasonable to use 
channel sequences belonging to an Ungerboeck code which have the largest squared free 
Euclidean distance. However, under the assumption that differential operation is required 
at the receiver, the trellis code we need will not be an Ungerboeck code. More precisely, 
we are looking for a trellis code such that, after differential encoding of its sequences, it 
results in coded sequences belonging to an Ungerboeck code (e.g. Fig.4a). Although we 
can use directly the related Ungerboeck code at the transmitter, we should know the 
"inner" code because the trellis to be used in the Viterbi decoder corresponds to that code. 
As said before, such a trellis code has twice the number of states of the "associate" 
Ungerboeck code. 
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Notice that differential operation on channel symbols involves multiplication and 
complex conjugate. For each 0 € i < 2M (expanded signal set) define channel symbols by 


s(i) := exp rN-1 = The set S := {s(i) | 0<1<2М) is an Abelian group with respect to 
the multiplication s(i).s(j) = s(i+j) O < i,j <2M, where i+j is taken mod 2M. 

Clearly, the unity element is s(0), s(0).s(i) = s(i), and the inverse of an element s(i) is 
s(i)”, s(i).s(i)" = s(0), where 5(1)* = s(2M-i) 0 Si < 2M, 2M-i being taken mod 2M. 





Ungerboeck code 


Figure 3. Block representation of the "differential" trellis code U' associated with 
an Ungerboeck code U. 


* 4-state 8-DPSK/TCM 


For simplicity, we first introduce as an example the 4-state 8-DPSK/TCM 
associated with the Ungerboeck 2-state 8-PSK/TCM (spectral efficiency 2 bits/s/Hz). 
Henceforth, a signal s(i) will also be denoted by i. Indeed, i'(k) = i(k) - i(k-1) mod 8. 
The design of the differential TCM can be achieved by splitting each node in the trellis of 
the associate (conventional) TCM code (Fig.4). Unfortunately, we shall see that these 
codes are based on nonlinear convolutional codes. Despite this fact, decoding can be 
performed using the Viterbi algorithm. 


Suppose, for instance, a code sequence (s'y) = 50 52 53 53 565 


Then, it can be easily checked that the respective differentially-encoded sequence, (sy) = 
O 52 85 50,653 5755;0.., belongs to the associated Ungerboeck trellis code. 


5462... 


8 5 8.8 5 8-5 55 
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TABLE I. State Transitions for a 4-state Convolutional Code associated with the 
2-state Ungerboeck Code. 






[new stae | sy | sg | state’ (node) 





2 k] 


Figure 4. Trellis diagram for 2-state U code and its associated 4-state U' code. 
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TABLE П. State Transitions for the 4-state TCM/DPSK Code. 


X2 Xi | Y2 Yi Yo 
00[1] 00 | 000 (0) 00[1] 
| 01002) 10[3] 
100 (4) oo[1] 
110 (6) 10[3] 
001 (1) 
011 (3) 
101 (5) 


011 (3) 
001 (1) 
111 (7) 
101 (5) 
000 (0) 
010 (2) 
100 (4) 
110 (6) 





We have used Karnaugh maps [KOR&KOR 1968] to minimize the Boolean 
functions: Y! =f,(X1;E1,E0) and Y Ó- fo(X1;E1,E0). 


The corresponding truth tables are presented in figure 5. Finally, the minimal 
encoder of such a code is sketched in figure 6. 
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Yı = Е Xi + Eo X1 + Ei Eo X1 


Yos El Eo + Е Eo = Eo Ф En 


= É1E0 6 Xi 


Figure 5. Truth tables for the output Boolean variables Y s Y? of the 4-state code. 


2 
1 
Xn 
1 
Yn 
0 
Yn 


Figure 6. 4-state nonlinear convolutional encoder for 8-DPSK/TCM. 


* 8-state 8-DPSK/TCM 


The approach to design an 8-state 8-DPSK/TCM follows in a quite similar way. 
We just outline the results. Tables ІП and IV present state transitions, figure 7 the trellis 


diagram, figure 8 truth tables and finally, the nonlinear convolutional encoder in shown 
in figure 9. 
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TABLE Ш. State Transitions for a 8-state Convolutional Code associated with the 
4-state Ungerboeck Code. 





` 





ЕЕЕ 


16 
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TABLE IV. State Transitions for the 8-state TCM/DPSK Code. 


input output new state 
X2 Xi | Y2 Yi Yo Ei Eo 
000[1] 


| 000 (0) 
| 010Q) 
100 (4) 


oo | 000) 
| 010) 


3 

1 

3 

ТЕ 011 (3) 100[5] 
010[3] 001 (1) 110[7] 
0103] | 11107) 100[5] 
010[3] | 101 (5) 110[7] 
7) 

15 

В 


011 (3) 
001 (1) 
111 (7) 
101 (5) 


1 
1 
1 
| 001(1) 

| 0113) 

| 101(5 

n | nio 
| 001 (1) 

| 011 (3) 

101 (5) 

111 (7) 


000 (0) 
010 (2) 


100 (4) 
110 (6) 
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000 (0) 
010 (2) 
100 (4) 
110 (6 





Қ AICA 
mo fo pu 
wfo pura U 
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Figure 8. Truth tables for the output Boolean variables Y А Y? of the 8-state code. 
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2 2 
Xn Yn 
xe! 

n 

1 
$— y, 
0 
Yn 


Figure 9. 8-state nonlinear convolutional encoder for 8-DPSK/TCM. 


11.2.3. TRELLIS-CODED DIFFERENTIAL MODULATION. 


The (noisy) received symbols are zy = sy (i) e? + nz k=0,1,....L-1. Since we 
consider an AWGN channel, the optimal (maximum likelihood) decoding rule consists of 
minimizing the squared Euclidean distance between the received sequence and the phase 
shifted coded sequences, that is, 


L-1 
MIN У d-sO eer, (1) 
k=0 
ө, i(k) 
k-0,1,...L-1 
S.L. 


{s,(i)} є ТСМ. 
where L is the length of the coded sequence corresponding to the decision delay. 


In the case of multiphase signaling, the channel symbols have identical energy so 
that eq (1) reduces to 


2 11 
МАХ Re X z si)" ed, (2) 
k=0 
Ө, (10) ) 
S.t. 


{s,(i)} е TCM. 


where * denotes the complex conjugate. For the sake of brevity, we drop the constraint 
on the maximization. Now applying the identity Же (21.22) = Re z1.Re 22. - $m 21. 
Sm 22, we get 
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L-1 " L-1 
MAX Фе (D, zx st) ) соз + Sm (У, zy вұй)”) sind. 3) 
k=0 k=0 
9, ( i(k) } 


First, we solve this maximization on the phase by setting Ө-бор, such that the partial 
derivative regarding Ө vanishes,i.e., 


-Re (У, zx s) ) sin@op + Sm (У, zx sy) ) COSO pp: =0. (4) 
k k 
Therefore, we have 
$m (YzskG)^) 
Өөр = arctg ———— —— |, (5) 


Re (D zs) ) 
k 


Using the polar representation of complex numbers, we found that 


Өор = arg ( Улұвұ()”), (6) 
k 
which finally yields 
Уд)“ 
exp( бор) = вад) . (7) 
IX zs.) | 


Inserting the above phase estimation оп eq(2), it follows that the optimal non-coherent 
decoding rule becomes 


(Y Zm sq) 
MAX Фе (D z s,(i)”) —————. (8) 


| X Zm Sm(i) | 
т 


Ө, i(k) ) 


CHAPITRE II: Problèmes de synchronisation de phase de la porteuse 121 
Consequently, the decoding is carried out by finding an information stream such that 


MAX [XD д si"l, (9) 
{ i(k) } 


where the sequence {sg(i)} is the output of the TCM (a coded sequence) corresponding to 
an input sequence (i(k)) (an uncoded sequence). 


The problem here is that the metric (9) is not an additive one so that we cannot use 
the Viterbi algorithm. As a consequence, the optimal non-coherent decoding rule 
(exhaustive decoding) is impractical even for codes with short constraint lenghts. In the 
following we present a simplification of such a decoding rule (a sub-optimum decoding) 
which gives a new interpretation of differential coding. 


Let us consider the simplest phase estimation, namely phase differential 
estimation, for which we take into account only a single term in (7), according to 


«бор. Gk-15k- (ONE (10) 
215-101 


This has the additional advantage of supposing a relatively constant carrier phase 
just over two consecutive signaling intervals, which is certainly a more realistic condition 
than to admit a stable phase over several signaling intervals. Furthermore, this could also 
be valuable over channels where the propagation delay changes with time. 

Now using this approximation, the decoding rule (2) becomes 


L-1 е i 
MAX Re У zi” O, an 
k=0 Га, 15101 
where the following definitions are used: 5.10) = 210 = 1. 


It should be pointed out that we have now an additive metric, so the Viterbi 
decoding algorithm can be used. 


We also recall the optimum coherent decoding rule (MLD) for trellis coded multiphase 
PSK modulation which is given by 
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MAX Фе У zy spä)“. (12) 
{skti)} е ТСМ. 


We suggest to define two new variables to be refered to as differential variables, 
according to 


sip) := ОЗЫ and zi) - KO HID (13) 
Ils. 6l la 07 


Thus, the binary operation "prime" combines consecutive symbols and 
corresponds to a differential encoding. It can readily be noticed that Is'y(i)l = Is,(i)! and 
Па" G) = Iz, (i)l. Figure 10 present schemes for both differential and inverse differential 
encoders. 





Figure 10. Schemes for direct and inverse differential encoders: 
(a) black box representations, (b) general differential operation, (c) differential 
encoder for M-PSK. 


The (sub-optimal) decoding rule (11) i.e., the differentially coherent decoding 
rule, can be rewritten as 


MAX Ñe Èz sÂ", (14) 
{skG)} є ТСМ. 


which has exactly the same mathematical expression as the coherent one (12) except the 
fact it involves differential symbols. More generally, even when channel symbols have 
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not the same energy, the use of the differentially approximated phase estimate (10) in the 
optimal non-coherent decoding rule (1) yields: 


L-1 


MIN У lz- sol. (15) 
k=0 


Accordingly, we should use a trellis code which has minimal squared free 
Euclidean distance between sequences {skG,)} and { s'x(i)} as large as possible. To 
this end, an Ungerboeck code must be used. The communication system of Fig.1 has 
been simulated considering the TCM as an Ungerboeck code, and the resulting error 
performance has been evaluated. The one-sigma statistical confidence interval as a 
fraction of the sample mean has been kept within 10%. 

As a result, we found that Ungerboeck codes are "invariant" to differential 
modulation in the sense that they are yet very good codes. This fact is also confirmed by 
the computer simulations (see Fig.11). It can be seen that the gain of 8-DPSK/TCM with 
respect to the theoretical uncoded 4-DPSK is practically the same as the coding gain of 8- 
PSK/TCM with respect to the uncoded 4-PSK. Furthermore, the schemes used have small 
complexity in comparison with other similar schemes [EDB 1987a, EDB 1987b]. 


a 
NRN 


Pe(bit) 
Ji 
zaii 





Figure 11. Simulated error rate vs signal-to-noise ratio (dB). Points correspond to 
uncoded 4-DPSK (shaded square); 4-state TCM / 8-DPSK (white square); uncoded 
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4-PSK (almost shaded square), and 4-state TCM / 8-PSK (almost white square). 


П.2.4. CONCLUSIONS. 


We have presented some aspects of the noncoherent detection of ТСМ coded 
systems. In particular, the design of TCM codes for DPSK modulation using differential 
coherent detection over the Gaussian channel has been considered. A family of nonlinear 
TCM schemes having twice the number of states of the associated Ungerboeck code has 
been introduced. By interpreting differential coherent detection as a first order 
approximation of the optimal noncoherent detection, we have found that Ungerboeck 
codes are still the best ones. A simple 4-state TCM / 8-PSK Ungerboeck code applied to 
DPSK modulation with differential coherent detection provides essentially the same 
performance as the uncoded coherent 4-PSK system at 105. A 4-state trellis complexity 
suffices to avoid the need of a coherent phase reference. Gains achieved with respect to 
an uncoded system having the same spectral efficiency and no requirements of coherent 
phase (e.g.,4-DPSK) are given. 
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BONS CODES DE RESEAU 
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ILI. A CAPACITY THEOREM FOR LATTICE CODES OVER THE 
GAUSSIAN CHANNEL 


"On se persuade mieux, pour l'ordinaire, par des raisons 
qu'on a soi même trouvées, que par celles qui sont 


venues dans l'esprit des autres” В. PASCAL. 


Il y a déjà longtemps que les réseaux, au sens mathématique et cristallographique 
du terme, ont été proposés comme technique de codage sur le canal gaussien [e.g. BLA 
1971, LEECH&SLO 1971 ]. Cependant, c'est seulement aprés la récente publication d'un 
article de Calderbank et Sloane [CAL&SLO 1987] sur les codes de réseau et de classes 
latérales qu'ils ont suscité un grand intérêt. Il y a maintenent consensus sur le fait que 
ces codes constituent une technique puissante dans le domaine de la modulation codée. 
Son application pratique a été immédiate puisque, dés la fin des années 80, les réseaux 
de Gosset et de Leech ont été utilisés dans un MODEM numérique (chez Motorola) 
sur le canal téléphonique [LAN&LON 1989]. 


L'intérét pour ce type de codage remonte en particulier à une étude de R. de 
Buda [deB 1975], qui a montré en applicant le théoréme de géométrie des nombres de 
Minkowski-Hlawska [CAS 1959] qu'il existe des codes de réseau dont les performances 
sont trés proches de la limite théorique (la capacité du canal). 


J'ai repris et modifié ces résultats pour établir un théoréme sur la capacité du 
canal gaussien quand des réseaux de nombre de dimensions élevé sont utilisés pour 
définir les constellations. 


J'ai repris le raisonnement sur le "durcissement" des hypersphéres quand le nom- 
bre de dimensions tend vers infini. J'ai démontré que cela résulte de la loi faible des 
grands nombres pour des variables aléatoires de distribution en chi-2, en applicant la 
théorie des distributions [BOU 1964]. 

D'autre part, j'ai repris l'interprétation géométrique bien connue d'entassement de 
sphéres [SHA 1949] pour l'adapter au cas des codes de réseau. Cette approche a permis 
de démontrer un théoréme ой est explicité le rapport entre le paramétre a du réseau 
(rayon de la sphère de même volume que la région de Voronoi) et le débit R en bits 
par dimension. Ce théorème aboutit à deux nouvelles bornes sur la probabilité d'erreur 
des t de réseau, qui jouent un róle essentiel dans la démonstration du théoréme de 
capacité. 

J'ai ensuite démontré un théoréme de capacité pour les codes de réseau sur un 
canal à bruit additif, gaussien et blanc: d'abord, l'assertion négative (strong converse) 
que la probabilité d'erreur tend vers 1 quand le débit est supérieur à la capacité, quel 
que soit le réseau utilisé; ensuite, l'assertion positive (direct statement) de l'existence 
d'un réseau dont la probabilité d'erreur est aussi petite qu'on le souhaite quand le 
débit est inférieur à la capacité. Tout comme dans le théoréme de Shannon, ces 
résultats montrent l'existence de bons codes mais ne donnent pas de solution explicite 
du probléme. Cependant, si le codage aléatoire n'est pas vraiment réalisable car 
l'absence de structure, empéchant toute forme de simplification, rend le décodage 
beaucoup trop complexe pour une réalisation effective, les codes de réseau ont au con- 
traire une forte structure algébrique et géométrique qui peut être utilisée pour 
simplifier la táche de décodage. Cela s'est bien vérifié dans le cas du réseau de Leech 
pour lequel de nouveaux algorithmes rapides viennent d'étre introduits et permettent 


This work was presented in part at the IEEE/SBT Int. Telecomm. Symp. Brazil 


CHAPITRE ІП: A Capacity Theorem for Lattice Codes over the Gaussian Channel 128 


une diminution étonnante de la complexité du décodeur [cf. 1.4.2.1]. Finalement, j'ai 
obtenu unc expression explicite d'une fonction de fiabilité [VIT&OMU 191982, GAL 1968] 
E(R,C) pour les codes de réseau sur un canal gaussien en montrant qu'il existe des 
codes dont la probabilité d'erreur est bornée exponentiellement par 

P, < exp(-nE(R,C)), 


oü n est la dimension du réseau et C la capacité du canal. 


ABSTRACT 


A capacity theorem for lattice codes signaling is presented which is based on an upper 
bound on the error probability introduced by R. de Buda. It is shown that lattice codes 
can be used to achieve the channel capacity for any signal-to-noise ratio (direct state- 
ment) and the negative statement of the capacity theorem is also proved (a strong con- 
verse to the capacity theorem). The sphere hardening is shown to result from the weak 
law of large numbers. The proof allows a better understanding of the application of 
dense lattices as an efficient signaling alphabet. An expression of the reliability func- 
tion E (R,C) for lattices in AWGN channels is also presented. 


Ш.1.1. INTRODUCTION 


A LONG TIME PASSED since Shannon's work [1] before the transmission at rates 
close to the channel capacity (near the cut-off rate) becomes a reality. The conven- 
tional coding techniques introduced during three decades were shown to be useful only 
for channels in the power-limited region. It was thought that coding had very little to 
offer to channels in the band-limited region [2]. A breakpoint was finally introduced in 
Ungerboeck's famous paper on set-partition coding [3]. A new research area in coding 
theory namely, coded-modulation, was created which has met tremendous interest and 
immediate practical applications, specially in digital МОРЕМ; (41. 

Although dense lattices have long been suggested as efficient codes in Gaussian chan- 
nels [5,6,7] it seems they became attractive after an excellent paper by Calderbank and 
Sloane [8]. Since then, coding theorists had increased attention to lattices and cosets. 
These are an alternative way to represent the coded modulation systems: coset codes 
(lattice codes) are a powerful and attractive representation of trellis-coded (block- 
coded) modulation. The main fundamentals on cosets and lattices as a coding tech- 
nique were recently introduced by Forney [9,10]. The interest in lattice codes stemmed 
from the work of de Buda [11] who showed that high dimensional lattices can be used 
in order to reduce the error probability in the presence of Gaussian noise and that such 
a code asymptotically achieves the channel capacity at high signal-to-noise ratio. In the 
present paper, we show that lattice codes can achieve the capacity at any signal-to- 
noise ratio and we also prove the negative statement (strong converse) of the capacity 
theorem. These results confirm those discussed by de Buda in a more recent paper 
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[12], but in a simpler way which moreover relies on the same tools as he used in his 
earlier work. 


The paper is organized as follows. Section ІП.1.2 introduces upper and lower bounds 
on the worst case error probability which are a slight modification of those presented 
by de Buda [11]. Sphere hardening theorems аге presented in section IIL.1.3 and they 
are used, in section IIL.1.4, to prove a capacity theorem for lattice codes over the 
Gaussian channel. Finally, a reliability function for AWGN channels is introduced in 
section III.1.5 assuming that a lattice code is used. 


III.1.2. BOUNDS ON THE ERROR PROBABILITY 


Some bounds introduced here are essentially a modified version of those presented by 
К. de Buda. Let J,(r) denote the volume of a hypersphere of center x and radius r, 
B,Qr) = (x'eR" | |x’-x| S r ), which is given by 


Jar) = Va r^ (1) 
where V, = PIT) is the volume of a normalized n-sphere. 


Let us suppose now that the n-dimensional bandlimited noise is AWGN with average 
power N, so that 


r= (ni, n2, -s Mp) (2) 


where (п;) are independent identically distributed (i.i.d.) Gaussian random variables of 
zero mean and variance М, (denoted by nj = N (0,N,)). Here, М, denotes the variance 
(average power) of the noise in each dimension. Of course, since the n-dimensional 
noise is isotropic, one has №, = N /n. 


Let r be the magnitude of the noise vector. Then 
r?2abenhecc + п2 = |02. (3) 
The n-variate probability density of r is given by 
P, (£) = QxN,) "? exp(-r7/2Nn) (4) 
and the corresponding normalized probability density is 
Z,(r) = Qr) ""exp(-r^i2) . (5) 


The n-variate chi-square distribution Q (x2 |n) is the probability that the sum of n 
squared normalized Gaussian random variables exceeds #2. It is convenient to express 
Q(x? |n) as: 


QG?|n) = |2,0) a, . (6) 
x 


It is well known that maximum likelihood decoding (MLD) in AWGN is equivalent to 
choose the signal point closest to the received signal. Thus, the decision region of each 
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lattice point x, coincides with its Voronoi region V(x,). Given that a lattice point 
х = xy was transmitted, the conditional error probability is 


Pg (x) = P (outside VGx)lx) = 1 — Í P, (xytr) dV . (7) 
VQ) 
In an unbounded lattice, because of both the lattice symmetry and the additiveness of 
the noise, it follows that 


Pe(x)=1- | P,(r) aV =PO. (8) 
vO) 


Then the probability that the noise alone is outside the Voronoi region surrounding the 
origin is the error probability Pg of any lattice point, that is, (Vxe А)  Pg(x) = Pg. If 
the signaling set Q (coded constellation) is given by all the points of a lattice con- 
tained in a bounded region, the outmost signal points have Voronoi regions which are 
larger than V (0) so they have an error probability less than Pg. Thus, Ре is the worst 
case error probability. It can be bounded as follows. 


Lower Bound 


Let (xy) be points of a lattice A, and let us consider n-dimensional spheres of radius 
а, A(x) = В,„(х,,а), having the same volume as a Voronoi region namely, 
V (xx) = V (0) = det A, that is, such that 


J,(a)= detA. (9) 
Since Р,(ғ) is а monotonically decreasing function of r, it follows that 
P (inside A(0)0)= J P,(r) dV 2 P(inside У(0)0)- | Р,(ғ)4У. (10) 
A(0) VC) 


A simple bound on Pg can be obtained by taking the complementary event іп R”, i.e., 
P (outside A (0)|0) < P (outside V (0)]O), so that 


ІР, c) 4,0) < Pg 11) 
a 
or, after changing the integration variable 
Pgz | Zr)dsC)s Q(?^IN, | n). (12) 
alNN, 


Upper Bounds 


A simple upper bound on Pg can be obtained by taking a hypersphere B (0) = B,(0,p) 
with center at the origin and radius p=d „1/2, where d min is the minimum distance 
between the lattice points. Let B°(0) be the complementary set of such a hypersphere. 
Obviously, P (outside V(0)|O) < P (outside B (0)|0) or 
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Pes | PaE av = |Р,(ғ) ao. (13) 
B“(0) Р 
Finally, we obtain 
Pes | 2,94,(73- ОМ, In). (14) 
oN, 


From (9) and the definition of the lattice density A [13], the relationship between p 
and a? can easily be shown to be р? = Д2"а?, so (14) may be rewritten as 


Pg < Q(A"a?IN, |n) . (15) 


At this point, it is worthwhile to mention that (14) may be interpreted in a very 
interesting way. The signaling set 9 (coded constellation) is given by all points in a 
bounded lattice with average power Р (Q). Then 


2 2 
p. PED ain =o 
PES 965 @ N n|n) ОС соу! njn). (16) 
A figure of merit of the coded constellation is given by FM (Q), where 
? (02:12) 
sp cmm. 
FM (Q) =: 5 O PO (17) 


Let us now suppose that decoding is effected by taking hyperspheres B (xx) = B,(xx,b) 
with center at the lattice points x, as decision regions. The radius r - b « a of these 
spheres will be selected later. Two types of error can occur with probabilities РЕ/ and 
РЕП, respectively. First, when the received signal is outside the correct decision 
sphere. Secondly, since the decisions sphere overlap, when a signal from a wrong lat- 
tice point is found inside the decision sphere, such an ambiguous decision will be 
counted as an error of type II. 


The type I error probability P£J can easily be determined by 
Pel = |Р,(ө) 40) = QG?IN, |n) . (18) 
r 


The type II error probability is bounded in a more complicated way, according to de 
Buda's bound. Let ў: AR be a Riemann integrable function and let us denote by 


fA) УР) (19) 
хєл 


the sum of f (x) over all lattice points except the origin. For a lattice point х + 0, ће 
type II error probability is 


Pell@)= | P,@&-r) dV(r) = fx) Q0) 


trier 


so that 
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Pell) = f(A) . (21) 
Іп order to obtain a bound over РЕП, it is intended to use the following theorem of 
the geometry of numbers [11]: 
THEOREM 1 (Minkowsky-Hlawska/de Buda): With f(A) defined as above, given 
€ > 0, there exists a lattice with detA = е such that detA . f (A) < | Ро) dV) 
о) 


The first step for determining the bound оп РЕП is the evaluation of the integral 
I= | feo dvo) Q2) 
(х) 
where f is given by (20). Substituting (20) in (22) and interchanching the order of the 
integrations (which is possible due the steep decrease of P, (.)), we have 
t= | J P,G&-r) у(х) дую). (23) 
ler a. т 
Since P,(.) is a probability density, the inner integral is unity, so 
I= J ave 40. (24) 
Irl<r 


The application of (22),(24) and Theorem 1 implies that a lattice exists which verifies 


F(A) . Jala) S In (7) . (25) 
We can now apply the union bound and (21) so Pg is upper bounded by 
Pg S РЕІ+РЕП = Q(r?IN, |n) + Jaryn la) . (26) 


The parameter r (radius of a decision region) will be given the value b such that the 
tightest bound is obtained. It is a solution of 


ЮША. Za (r INN, ) + 114, (a NNa) =0 . (27) 
d,(r VN, ) 


This equation has a single real positive root r = b, namely: 
b = NN, (2in Ju (a NN, )-піп(2л) . (28) 


The tightest upper bound is thus 
Pg S Q?IN, |n) + Z,(BINN, ) .J4(5) = CON, |n42) (29) 


where equality results from integration by part (see also Abramowitz-Stegun [14]). 
Substituting the volume of a normalized n-sphere and rearranging, we obtain 
2 
PN (2. 


(30) 
Te) x 
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Ш.1.3. SPHERE HARDENING THEOREMS 
We are now interested in the behaviour of 00 |n) for n very large, where x? =r? 
given by (3). Let us consider the following random variable transformations: 

TABLE I. RANDOM VARIABLE TRANSFORMATIONS. 


is 





probability densi 















r Xn роби) = 022 
Pun 
r? Xn P,2(E;n) = exa) 
212 TG 
r?In y2 In Р, 2„(Ё;п) = opr p exp 8) 





where 
P,in(Esn) = P, (n5 ; ne =P,2(nE;n).n. (31) 


Thus, О (x? |n) may be expressed alternatively by: 
QQ’ = [PG а= | P 6o 45. (32) 
x Xin 
THEOREM 2: For any real 22, the chi-square function verifies 


Foni 2 —. J0 if Atl, 
Jim QU n|n =1 ca 1) AS = E otherwise. 


The proof is based on a few results which allow a better understanding of the sphere 
hardening phenomenon and will be discussed later. 


THEOREM 3 (Weak law theorem): Let {X;} be ii. random variables with 
n 

Xie N (0,02) and W = 1/пу, X;?. Then the limit in probability of W is 67. 
1 

proof. The mean and variance of such a distribution can be shown to be E(W) = o? 


and — Var(W) = 2(62)2/п. By the Chebyshev inequality it follows that 
P (|W—o?| >£) «2(02)?/(n£?)20 as neo Q.E.D. E 
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The Theorem above сап be used to show that P,2,, (Ë;n) defines a generalized function 


as we see by the following 


THEOREM 4: The sequence of functions (P,2,,(5;n)) defines the Dirac distribution 


56-1). 
proof. We know that 
J P,6: п) а= 1 


because P,2,,(.;n) is a pdf. On the other hand, from Theorem 3: 
1+ 
12 f Р,2„(Ё; п) dé =1-P(W-1|> е) > 1-2/(ne?). 


le 


Taking the limit (when z increases indefinitely) in the expression above, 
l+e 


lim | P,3,06:md&-1. 


im 
ne 


Then lim P,2,,(&;n) = 8(6-1) follows from (33) and (34). Q.E.D. E 
поо 


proof of Theorem 2: 
Writing О (An | n) in terms of the density (31)of the г.у. r?/n, we have 


002n |n) = J Pn ;nd$ ог 
À 
lim Q Q?n |n) = lim. ЈР, : п) dE. 
noo ne РЫ 
The application of Theorem 4 yields: 
lim 0(22п |n) = Í 5(E-1) dé and the result follows. Q.E.D. B 
п--же X 
LEMMA 5: For any integer v, іт Q (Ал |n+v) = I (102) 
n-»o 
proof. Once again, we write О (x2 |n) in terms of P,2,,(;n) 
lim QQ2n |n+v) = lim Р, „(Ё ;n+v ) dé 
п-э n» 2 


but Р, 2„(Ё ; п+у) = P,*(n& ; nt+v).n. 


(33) 


(34) 


(35) 


(36) 


(37) 


When n grows, P,2( : ;n) > P,2(: ;п+у), so that lim P,24,(* ;n4v) = lim P,2,(- 37) 
noo n 


and the proof follows from Theorem 2. Q.E.D. E 
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1.1.4. CODING THEOREMS FOR LATTICE CODES 


The bounds introduced in section II depend on two parameters a and b, so we must 
find the relationship between these parameters and the transmission rate R. This can be 
done with the aid of a geometrical representation of signals and noise as shown in Fig- 
ure 2. 

The volume of a Voronoi region is V(0) = detA and we took spheres with same 
volume as V (0) according to (9). If the transmission rate is R bits/dimension, then the 
total number of such n-spheres (or signal points) is 2%, The total volume occupied by 
all the Voronoi regions is 2" . det A = 2" . J,(a). Suppose that the code consists of 
all lattice points inside а hypersphere of radius Уа2- 5 (see Fig. 2), so the available 


volume is J,(Ya? + S). Then V, (Ya? + 5)" = 2% Уа", so that 


R= i logo((a?--$)/a?) . (38) 


THEOREM 6: Given a lattice A, if the rate R is less than the channel capacity C then 
a?/N > 2XC-9). In contrast, if the rate R exceeds the capacity C, then a2iN < 2AC-R), 


proof. The relationship between the lattice parameter a and the transmission rate R is 
given by (38) which implies a? = S (27-1). On the other hand, Shannon’s capacity 
formula leads to S/N = (27-1). Thus, 


a?/N = (22€ 1) 27-1 , (39) 
This relation can be rewritten as 
2 2С : 2C 
а _ 2-1 — »UR-—) 2-1 
N id 22С 22%-С). 1 -2 22C LoXC -R) Қ (40) 


The proof is completed by comparing the second term of the right side of (40) with 
unity. Q.E.D. E 


Recollecting the bounds obtained in section II, 

Q(a?/N, |n) S Pe < Q(b?/N, |n+2) . (41) 
The proof of the capacity theorem is based on new bounds derived from these ones 
and theorem 6 as follows. 7 
THEOREM 7 (Capacity Theorem) 


Positive statement: If the rate R in bits/dimension is less than C, some lattice code 
exists such that the decoder error probability tends to zero as n grows. 


Negative statement: Conversely, if R exceeds C, any lattice code has error probability 
near onc. 


proof. 
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(negative Statement) Any lattice code with R » C verifies the inequality 
a?/N n < 22С-Ҝ)һ =: a?/N n which is an immediate consequence of Theorem 6. 
Then the worst case error probability for a lattice code obeys the following lower 
bounds: 


Pg > Q(a?/N, |n) > Q(o2/N, |n) . (42) 
By hypothesis, R > C, so that R = С + €/2 for some € > 0. Applying the lower bound 
(42), any lattice code must verify Pg 2 0(22С-Ә, |n) = Q(2*n |n). When the 
dimensionality increases without limit, then lim Pg 2 limQ(2*n |n) = 1 (from 
noo 
theorem 2). 


(Positive statement) Analogically, the application of Theorem 6 to the lattice code with 
rate R < C yields the following inequality: 


T?n( 2.41) 


b?/N, > 2n1n2|C -R -i log? =: EN, (43) 


n/2 


so that the worst case error probability verifies the upper bounds: Pg < 
Q(b?/N n |n+2) < Q(B/N n |n+2). 
Let us now examine the condition B2/N > 1. From (43) this implies 


ETE NM (44) 
2 n/2 
Let us define 
C(n) =: C- 1 aoe : (45) 
2 n/2 


Then C(n)- С + ф(п), where ф(п) is a function which approaches zero when n 
increases indefinitely, as we shall see by 

LEMMA 8 : C (n) approaches the channel capacity C when nee, i.e., lim C (n) = C 
bits/dimension. 


proof. By the Stirling approximation, TC) = Vin(n/2e)"” so that 


rma 
eT (5+) 


= (nn), 


an n large. 


Therefore, ф(п) = ову (nn) goes to zero as по, and the proof follows directly 


from the definition of C (n). Q.E.D. E 
Rewritting the upper bound on Pr, 
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Pg < О(ВИМ n |п+2) = Q(QIn2(C (n}-R}+1) п [n42) . (46) 


The rate is less than C, so R -С-Е for some € > 0. From Theorem 1, a lattice code 
exists such that: 


BAN = 2 12 (e-O(n)}+1 and lim B/N =2eln2+1. 
Applying the upper bound (46) when n—»e» gives 
lim Pg < lim Q (B/N, |n42) = lim Q[(1+2eln2) п |n+2]—0 
no n» 


(from Lemma 5 Q.E.D. E 


This result has a well known geometrical interpretation. If а2-» М, then Еэ С fol- 
lows from (38). Futhermore, po b? and o2— a? follows from (40) and (43). If 
a? — N, then b — a when n— and the upper and lower bounds in (41) agree. For 
high dimensionality, the noise becomes concentrated on the surface of a hypersphere 
of radius equal to the average power of the noise (consequence of Theorem 4). Each 
lattice point is the center of a hypersphere of radius b (b — a). If the signal plus noise 
is in the n-sphere around a lattice point x, it will be decoded as x. Then if 
а? > N (b? a? >N), the received signal will be at the surface of the hypersphere 
around the transmitted lattice point as 7—> and no decoding errors will occur. In con- 
trast, if a? « N, then b?— a? « N and the signal plus noise points will be almost 
surely decoded in a wrong way. To summarize, if a? > N then Pg — 0 as n grows, 
otherwise Pg => 1. 


The use of dense lattice codes is explained as follows. Let us suppose that the n- 
dimensional lattice was obtained by rescaling [13] a lattice A", i.e., A = (p/p°)A°. 
We can rewrite equation (9) as a? = (detA/V, )2/" so that a? > N implies 


(detA/V,J7 > М. (47) 
But detA = (p/p° Y' detA", hence the above equation yields 
р? Ay?" >N. (48) 


Then we must take a compact lattice А” and use a rescaled version A so that the 
minimal distance 2p between lattice points obeys (48) 


Ш.1.5. PERFORMANCE ОЕ LATTICE CODES OVER THE AWGN CHANNEL 
А reliability function for the AWGN channel can also be obtained by 
THEOREM 9 : If R < C bits /dim, then a lattice code exists such that 

Pg < 5 exp(-nE (R,C)) 


as nee, where E(R,C) = Е(Е-С) = (\1+2 In2 (C-R) - 1). 
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proof. For x? > n + 2, n large, the following approximation of the chi-square distri- 
bution can be used: 


QC IR +2) = i eríc( x? —n41.5) < i exp- (Vx? Vn 41.5%, 


Let Y = (2In2.(C (n) — К) + Ол. We find it convenient to express y? as 
x? =(1+21n2.(C -R – q(n) – 1. log;e)n +2. 


If R < C, there is € > 0 such that C — А = e. For a lattice with a large enough dimen- 
sion n, € > ф(п) + + loge, so that X) > п +2. In this case, the chi-square approxi- 


mation gives 


PE < 5 expl-n(V2In2 . (C (n)-R)«1 — V1+1.5/n )2]. (49) 


Let us consider the function E,(R,C) defined as 
E,(R,C) =: (02102. (C (п)-Е)+1 -N141.5/n ). 


When n grows, this results in 
lim E,(R,C) = (V1+21n2 (C-R) – 1? as ne. (50) 


If we define the reliability function E (R,C) as the above limit, it follows that a lattice 
exists for which the error probability is bounded as proposed. Q.E.D. Ш 

It is interesting to note that even for relatively small n, the approximation 
E,(C-R) = E(C -R) is remarkably tight. We present in Figure 3 the E (R,C) function 
for ап AWGN channel with SNR - 27.1 dB as an example. We һауе used as a bound 
Pg « > SERIO instead of i exp[-nE (R,C)], where E2(R,C) = Е(Е,С)Лп(2). 


It is now well established [15,16] that the Leech lattice can be used on telephone chan- 
nels (B = 2742.86 Hz, SNR = 27 dB) for transmitting at R = 3.5 bits/dimension (or 7 
(bits/s)/Hz) with an acceptable error probability, which yields a 19,200 bits/s digital 
MODEM. It can be seen that lattices are powerful coding tools to allow reliable 
transmission at high rates (near the cut-off rate Ro = 4.0 bits/dimension, at present). 
Some bounds presented here have been applied to the Leech lattice at rate R = 7 
bits/2dimensions. These results show that in spite of the very high number of neigh- 
bours, Ре may be quite acceptable. Both near and above the cut-off rate, the union 
bound is useless. 


Ш.1.6. CONCLUSIONS 


The Minkowski-Hlawska theorem of the geometry of numbers was used by R. de 
Buda in place of the random coding argument to show that lattice codes are close to 
the optimal codes at high signal-to-noise ratios. This result was modified here to prove 
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capacity theorem for the Gaussian channel (negative and positive statements) when 
high-dimensional lattices are used as signal constellations. This approach allows a 
better understanding of the sphere hardening and the use of lattice codes to achieve the 
channel capacity for any SNR. Error bounds are also presented, including an E(R,C) 
reliability function for lattice coded AWGN channels. 
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Figure 1. Regions concerning the bounds. 
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Figure 2. Sphere packing representation of lattice points. 
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Figure 3. Reliability function E2 (R,C) for a Gaussian channel (SNR = 27.1 dB). 
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IIL2. PERFORMANCE OF LATTICE CODES OVER THE GAUSSIAN CHAN- 
NEL 


"Lattices are to block codes as classical music 
is to rock and roll", NJ.A. SLOANE. 


ABSTRACT 


We develop an upper bound on the error probability of lattice codes combined with 
Quadrature Amplitude Modulation (QAM) over the additive white Gaussian channel. 
This bound depends on a lattice figure of merit and is readily put in exponential form 
by using Chernoff bound. An interesting lower bound is derived by a similar reason- 
ing. We also discuss the continuous approximation used to estimate the average power 
normalized to two-dimensions, and suggest to improve it by using the sphere packing 
idea. Examples of performance evaluation are given for a few lattices. Finally, we 
present upper and lower bounds on the best fundamental coding gain per dimension 
(due both to density and covering) for an arbitrarily large number of dimensions. It is 
Shown in the Appendix that, as the Ungerboeck codes, the lattice codes do not shape 
the signal power spectrum. 


1.2.1. INTRODUCTION 


There 15 a renewed interest in coded signaling strategies based on finite- 
dimensional constellations (e.g., lattices) in order to improve the noise immunity [1-6]. 
Ever since Shannon's monumental work it was clear that a strong relationship exists 
between increasing transmission rate toward capacity and achieving dense structures in 
high-dimensional spaces. However, most coding theorists have raised the interest in 
lattice codes just a while ago when solid bases of this theory were laid by Forney [7]. 
Furthermore, it has been recently reported that lattices exist which can achieve the 
capacity over the Gaussian channel [8,9] showing that this coding technique is quite 
powerful. 


We deal in this paper with finité-dimensional signaling schemes based on lattices 
even though the ones supplied by (time-invariant) infinite-dimensional packings i.e., of 
the trellis-coded modulation type, appear to be still more powerful. We intend essen- 
tially to clarify the tradeoff between signal-to-noise ratio and transmission rate for 
such schemes. A constellation (an n-dimensional signal set), denoted by О = C (A,R), 
consists of the points of a lattice A (or a translate of A) that lie within a region R. If 
|Q] is the cardinality of the set О (i.e., the number of its signal points), then the 
transmission rate per dimension is given by 
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= " log; |Q| ^ bits/dim. (1) 


Furthermore, let P (Q) denote the average power of the n-dimensional signal points 
(the average squared Euclidean norm of the constellation). The average power normal- 
ized to 2-dimensions (2D) is, therefore, given by 


Р(С) = 2 P (Q). Q) 


We shall develop upper and lower bounds on the (block) error probability which 
depend upon lattice parameters. Our interest will be focused on combining lattice cod- 
ing and modulation. Examples of performance evaluation are provided for a few well- 
known lattices. We also discuss the asymptotic behaviour (for an arbitrarily large 
number of dimensions) of theses bounds and we are led to conjecture that "covering" 
becomes more important than "packing" for rates beyond the cutoff rate. Our purpose 
is to prompt engineers to think of the deep connection between sphere packing prob- 
lems and capacity, a very old matter. The last section provides some insightful argu- 
ments in this direction. 


Ш.2.2. BOUNDS ON THE n-DIMENSIONAL ERROR PROBABILITY 


We shall assume QAM modulation, which implies transmitting а 2D-symbol 
(phase and quadrature components) per time interval T. The corresponding waveform 
is 


Sr(t) = ас u(t) cos(2rf.1) — as u(t) sin(2nf.t), (3) 


where u (t) is a narrow-band waveform, f. is the carrier frequency, and (a,, а,) are the 
symbol coordinates. We assume that n/2 successive pairs of such symbol coordinates 
(n even) are restricted to be the coordinates of a point of an n-dimensional lattice. We 
then establish the following result: 


THEOREM 1. The error probability of lattice codes over the Gaussian channel is 
upper bounded by Р, (п) < Q (FM (P,Q) Yan | n), where Q (?| n) is the x?-function 
with n degrees of freedom and FM (p,Q) is the constellation figure of merit defined by 
(19), and Yay is the signal-to-noise ratio per dimension. 


proof. Supposing a signaling rate of 1/T bauds, the lattice coded QAM signal s (1), in 
terms of its complex envelope, is ua by 


s(t) = Re( 2 > Py” ult - (7 + m] eiT), (4) 
k=—> m=1 
where the complex Pf” = al жуа) = (att, aff) represents а constituent 2D 
point or symbol. 
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қ А : SE. i 
The k-th transmitted signal corresponds to a lattice point Py є A whose coordi- 
nates are given by n/2 two-dimension constituents, that is 


Pe РР}; BP 5) 
or, more explicity, each coded signal is an n-dimensional point 
Р, = aaa: aa. © 


It is shown in the Appendix that, as the Ungerboeck codes [10], the lattice codes do 
not shape the signal power spectrum. The coded signal has a power spectral density 
expressed by 


sf) = HO (ва BALE шегә. (7) 


The average power, P av, of the transmitted signal (*) is found by integrating the above 
equation, namely, 


EO ы 


EX (8) 


- Г S,(f) df = 


+o 
where E, = Í u0]? de = T |U(f)|? df is the energy of the narrow-band pulse 


u(t). Hence, the average energy of the transmitted signal s(t) is Egy = P (C)E,/2. 
On the other hand, the noise n, (t), is assumed to be an additive white Gaussian 


random process and we will use its pass-band representation in a bandwidth B hertz. 
Thus, the narrow-band waveform of the noise can be expressed as 


ny (t) = no(t) cos(2nf.t) — ns(t) sinQnf.t), (9) 


where no(t) and n,(t) are both low-pass noise signals band-limited to B/2 having as 
power spectral density 


S.) = S0) = S diis (10) 
Moreover, it is assumed that the constituent 2D signals on the phase and quadrature 
carriers are perfectly separated by coherent detection and that maximum likelihood 
decoding (MLD) is carried out by thé decoder after the reception of an n-dimensional 
signal (block). The diagram of such a receiver is shown in Figure 1. The received sig- 
nal s(t) + n,(r) is processed as indicated: a coherent detection is performed, followed 
by matched filtering and decision-making after each block. 
Following comments made in [11], we are interested in the signal-to-noise ratio 
per dimension: 


(*) It sould not be confounded with P (C) which depends only on the lattice. 
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Yav = Eav/No. (11) 


Each time interval T, a corrupted constituent 2D point YU? = (Py (^) is received 
namely, 

vp =P ew. (12) 
Неге, wg» is the constituent 2D noise vector which is given by wy = (ww). 
- Moreover, the random variables м) апа м0") are independent and identically distri- 
buted, namely Gaussian variables with zero mean and variance 9? = №/Ё,. 


Thus, the received (noisy) n-dimensional vector, Y, = qi w, ini ivf), is 


expressed as 
Y, =P, + W,, (13) 
that is, the transmitted lattice point is perturbed by the n-dimensional noise vector: 
De WPWP: «> we), ae 


Furthermore, it is well known that MLD on the Gaussian channel is equivalent to 
choose the lattice point closest to the received signal, that is, decision regions are 
exactly the Voronoi regions. The minimum Euclidean distance between two lattice 
points is dmin = 2p. A simple bound on the block error probability (an n-dimensional 
received point) can be developed taking 


Pe(n) < P ([W,|| 2 dmin/2). a5) 
The squared norm of the noise vector can easily be found using (14), 
n 
I.P E WEP + WHY. (16) 
m=1 


Therefore, we have the sum of n squared Gaussian random variables with the same 
distribution. This can be normalized in order to obtain an n-variate chi-square distribu- 
tion [12] by putting (15) in the form 





2 
n dei /4 
Pen) <Р(У 22 2— 
izl o? 
where the n new random variables z; are normal ones with zero mean and variance 
unity. Of course, this is readily written in terms of the X? -function with n degrees of 
freedom, resulting in 


) (17) 





dii 14 
Pe(n) < ОС en Im. (18) 
where О (Х |л) = ЕНІ өрсе?) dx. Finally, a constellation figure of merit [9,11 
x 2"?T(n2) 
also 13] has been defined to be 
2 а44/4 
FM (p,Q) = ¿E = —™ (19) 


P(Q РО)” 
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and the proof follows. W 


If the covering radius т of the lattice is used in (15) instead of its packing radius p, 
the inequality is reversed and we get the following corollary: 


COROLLARY. Тһе error probability of lattice codes over the Gaussian channel is 
lower bounded by Р, (п) > Q (FM (г,О) Yan | n), where FM (г,О) is the constellation 
figure of merit : 


FM (r,Q) := == (20) 
For a very large number of dimensions, the upper bound is roughly given by [12] 
P, (n) < 1/2 erfe(n [VFM Q, Ya — 1]. Qn 
It is convenient to define a parameter 2? as 
02 := FM(p,Q) Yav. (22) 


Obviously, for a fixed signal-to-noise ratio, this parameter 42 depends on the transmis- 
sion rate R. 

In the following, we present some applications of the above Theorem. First we 
remark that a signal-to-noise ratio Yay = 22 decibels is a quite high SNR for a 16-point 
QAM constellation while it is a very poor one for a 256-ary constellation. A simple 
question arises: what exactly does a high SNR mean? Of course, a good definition 
should depend on the constellation (in particular on its dimensionality). We have used 
the bound of Theorem 1 for the purpose of estimating the range of SNR resulting in 
an error probability within a given level е, that is, according to 


Q(FM (p,Q) Yav піл) < е, (23) 


and we have plotted, in Figure 2, the values of A? needed to guarantee an error rate 
less than e = 105, Thus, uncoded systems corresponding to M-ary QAM, must work 
at least at 3Yav/2(M —1) > 11.5, from which it follows that Yay > 7.67(M —1) in order 
to ensure an error probability less than 107%, 

Additionally, it should also be pointed out that for a very large number of dimen- 
sions, the behaviour of the error probability does not depend on the number of neigh- 
bours at the minimum distance. 


THEOREM 2. The n-dimensional error probability of a lattice-coded signal set is 
exponentially upper bounded by P, (n) € exp[- n С (2), 


2, 11202-1-1132) if 3221 
where С (0) = f otherwise. 
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proof. We recall that the error probability is bounded according to Theorem 1 which 
can be rewritten as 


P,(n) <Р (2 > п22). (24) 
іші 


Of course, the random variables {z;} are independent and identically distributed (1.1.d.) 
so Chernoff's bound [14] can readily be applied, resulting in 


P,(n)Sexp(-n[sÀ2- In M,2(s)]}  Vs20, (25) 
where М,2(5) = (1-25) 2 is the generator function of a г? variable. The tightest 
upper bound according to (25) is thus: 

P, (n) < exp[- n C (22)! (26) 
where 

C(A?) := тах [5А2 — In M,2(s)] = тах Fa (s). (27) 

s20 s20 


It can easily be verified that F4(s) is a convex upward function (convex (^, ) and that 
its maximum occurs at s = 1/2(A2 ~ 1)/A2. Thus, two cases are to be considered 
depending on the transmission rate. First, if 22 is less than or equal to unity, we find 
immediately that C (A?) = 0. Second, we remark that F,(s) has a maximum for 5 > 0 
when A? is greater than unity. Additionally, it follows from the fundamental inequality 
of information theory [14] (i.e., which expresses the convexity of the logarithmic func- 
tion) that C (22) is strictly positive when the maximum is reached, which completes 
the proof. E 


The main results of this section can be summarized by 


Q (FM (r,Q) Yavn | n <Р, (п) S Q (FM (P,Q) Yan | n), (28) 
where p < r which implies FM (p, Q) < FM (r,Q). 


11.2.3. LATTICE POINTS CONFINED IN BOUNDED REGIONS 


Forney and Wei [13] showed that the normalized power, P (C), is approximately 
equal to the average power P (R) of a continuous distribution that is uniform within R 
and zero elsewhere, resulting in 

P (C) = 2G(R) VR”, (29) 
where 


Гра» 


VR)=f dv ша GR=— 


à PET LIA EM 
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Here, V(R) is the volume of the region R and G(R) is its dimensionless second 
moment [15] which measures the effect of the shape of the region R on the average 
signal power. 


Forney and Wei (see [13] proposition 1, p. 883) also proposed the approximation 
VR) = |Q] V(A) (31) 


so (29) and (1) imply that the normalized power P (C) is related to both the transmis- 
sion rate and the fundamental volume. However, such an approach does not take into 
account the possibility of including boundary points. In the following, we go further in 
order to allow the use of the border of R. 

In order to get insight, we first consider the straightforward case of a 2- 
dimensional constellation with power limitation per one dimension according to Figure 
3. The available volume is then V(R) = (2doY? = 4d% while the fundamental volume 
(volume per signal point) is V(A) = di. Therefore the total number of points, |Q], that 
can be put into such a region is given by V (R) = |0) V(A) or |Q| = 4. 

However, it can clearly be seen from Figure 3.b that it is possible to put nine 
points inside the same region provided that boundary points are allowed. The counting 
could be done in the following way: we consider an augmented region R', 
V(R") > V(R), and we use the relation V(R”) = |Q| V(A). The volume of the aug- 
mented region is chosen such that the normalized volume is increased by that of the 
fundamental volume, so that | 


V(R*) = [V R)? + V(A)??, 


where V(R)? and V (A)! are respectively the volume of R per dimension and the 
additional volume per dimension. Therefore V(R*) = (240 + do}? = 9% 50 one has 
IQ] = 9. 

One can indeed justify the approximation (31) in the following way. Consider a 
finite and full set Q of points belonging to a lattice A, where "full" is intended here to 
mean that (2 contains contiguous points of the lattice and moreover that no holes are 
left i.e., any lattice point which is surrounded by points belonging to (2 also belongs to 
И. 


We may define the region К by associating with each point of Q a fundamental 
region which. contains it (i.e., whose. volume is the fundamental volume det(A); its 
shape is definite but arbitrary). Then, the union of the fundamental regions clearly 
defines a region R such that (31) obtains with equality. The fundamental regions asso- 
ciated with the lattice points tesselate the region R. 


This way of defining К obviously results in the points of Q being inside R since 
each of them is surrounded with its own fundamental region. One may ask what is the 
number of points which can be put inside R and on its border. One is thus naturally 
led to consider an augmented region R° which is the union of the fundamental regions 
associated with all the points inside R and on its border. The inclusion of such an 
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additional volume results in 
VR) = [V^ + v(Ay "p? 
The newly defined region R* now contains as many lattice points as R has inside it 


and on its border and (31) will be applied to R” instead of R. Stated a bit more for- 
mally: 


PROPOSITION 1. (COUNTING): The size |Q| of any constellation consisting of the 
points of a lattice A (or a translate of A) that lie within any bounded region R of 
volume V (R) is approximately 
Yn) п/2 
| ; (32) 


а= is 


proof. Consider two spherical regions R and A related to R and A, respectively, in the 
following way: R (resp. А) is defined as an n-sphere of volume equal to V (R) (resp. 
V(A)). In order to include signal points belonging to the border, we introduce a new 
region R , namely the augmented region, which contains the given region R and such 
that the added normalized power is that of the fundamental volume. Since the normal- 
ized power is additive, we have 


P (R`) =P Q) + P (Â). (33) 


Applying the continuous approximation and since the dimensionless second moment is 
the same for the above regions, it follows that 


V(R y^ = vR" + VA)". (34) 


We now estimate the number of signal points in the same way as Forney did but using 
the augmented region R instead of R, resulting in 


VR’) = [V(R^ + v(AY?^ Y? = |Q] V(A), (35) 


V(R) 
V(A) 











and the proof follows. Ш 


The volume of a hypersphere of radius ғ is given by J,(r)- V, r", where 
V, = n"? T(n/241) is the volume of an n-sphere of radius unity. Furthermore, suppose 
that the average signal power is S and the average noise power is N, considering both 
the Signal and the noise as n-dimensional Signals. If we take the radius of the region R 
as 7 = Mi and the radius of the region А as a, then the radius r of the augmented 
region к сап be found using (34), that is, 


JG Y!" =I," (ау, (36) 
so that re VS+a . Therefore, (35) can be rewritten as 
JF )= |0) (а). (37) 


This results in a transmission rate of R = 1/2 1ор2(1:5 ia^). This kind idea has been 


CHAPITRE Ш: Performance of Lattice Codes over the Gaussian Channel 149 


used in conjunction with the sphere hardening argument (one must have à > Nas 
n-—>30 in order to assert that the error probability goes to zero) in the original 
Shannon's proof of capacity theorem [16] and recently in the proof that lattices exist 
which can achieve the channel capacity [9]. 


PROPOSITION 2. (CONTINUOUS APPROXIMATION): The average signal power 
normalized to 2 dimensions of any constellation Q consisting of the points of a lattice 
A (or a translate of A) that lie within a region R is approximately equal to 


P (C) = 26 (R) [228 - 1] V(AY^, (38) 


where R is the transmission rate in bits/dim, 
G (R) is the normalized or dimensionless second moment, 
V (A) is the fundamental volume of А. 


proof. The proof follows by applying proposition 1 combined with (1) in order to esti- 
mate V (R) and then substituting the result in (29). | 


Next, we apply the above proposition in order to estimate the normalized average 
signal power of simple lattice-based constellations. First, we consider the M-point 
monodimensional amplitude signaling (PAM). The signal points are M odd-integers 
namely +(2i+1), і-0,1,:::, M/2-1, resulting in the true average power [17] 


P (C) 2 2 (M?-1y3. (39) 


On the other hand, this signaling scheme corresponds to take all the points belonging 
to the translate 22-1 of the lattice A = 22 (that is, the one dimensional even-integer 
grid) and a region R-[-(M-1)(M-1). Thus, one has V(A)=2 and 
V (R) -2(М-1), and the corresponding normalized second moment is 


1 б? 1 
2 
MÀ у“ dv = —, (40) 
1[XM-DP ' 4-1) 12 
so proposition 2 yields P (C) = 2.1/12.[M 2.114 i.e., the exact result (39). 

In a second closely related example, we consider the M-point two-dimensional 
narrow sense QAM. Now, the signal set is constituted by all the points in the odd- 
integer grid (the translate 2Z*+(1,1) of the lattice 272) within 
R = ESAMI M-1)]*. Remembering that the normalized second moment of an n- 
cube is 1/12, and that V(A) = 4, we get 


P(C) i 2.1/12.[M -1].4 = 2(M-1)/3. (41) 


G(R) = 
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II.2.4. GAINS, VORONOI REGIONS AND MORE ON THE BEHAVIOUR OF 
LATTICES 


The gain ү (Qı: Q2) of a constellation Qı = C(R¡,A,) with respect to another 
constellation Q, = C (R2, A2) at the same rate В can be measured by the ratio of their 
figures of merit, the superscript minus (plus) standing for values based on thc inradius 
p (circumradius r) of a Voronoi region. 


FM(pQ) рі P(C2 











ғ ; A г нң | 42. 
T Qu: 8a) = p ^ pi PC) ve 
FMGQ) ri P(C) 
Á | = = 7, : 42.b 
Y (01:9) CO). d PC) Com 
Now, under the continuous approximation (38), it follows that 
2 Un 
рі G(R) V(A) 
: = — << . me 43. 
2 Yn 
ті G(R) V(A2) 
: =>. ce 43.b 
Y (Q: Q2) 2 GRO VAD” (43.b) 


We can, therefore, split the total gains іп two parts: the coding gains 7, and the 
shape gains Ys, given respectively by 








a 82^(A1) 

Y: Aa) = grey (44.2) 
ea 

FAL D (44.b) 


"^ (A5) ' 
where ô and Ө are the center density and the normalized thickness of the lattice i.e., 


wp. FS 5 
6: VO) and 0 : V) (see e.g., [18, p. 13 and p. 32, resp.]), and 


y; (Ri: R2) = YQ: R;) = 





VG R) 
1/G (R2) ` 


The coding gain is easily seen to be the power saving due to the thickness of the lat- 
tice employed. Thus, the gain as defined in (43) can be expressed as 


Y (Qi: Q2) = yc (Ai: Аҙ) Ys Ri: R2), (46.a) 
Ү (Q1: Q2) = Y (Ai: Ag) ys R1: Ro). (46.b) 


In the particular case where the reference constellation is the uncoded one (i.e., that 
based on the cubic lattice Z"), we derive the expressions 


(45) 
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Ye (^: 2") тү А) = 48?" (A), (47.a) 
YE(A: 2") := YA) = 20? ^ (A), (47.b) 
and 
^ (R3: n-cube) := y.(R) = E (48) 
We remark yet that the coding gain is 
y; (A) = 4p2/det2" (A). (49) 


We can rewrite the above equation keeping Forney's notation, recalling that the funda- 
mental volume is V(A)=detA and that P=dmin/2. Thus, the coding gain is 
Ye (A) = азы МСА)" which agrees with the definition of the fundamental gain [7]. 


The application of the above approximations to Theorem 1 gives the following 
upper bound on the error probability: 


Р.(п) < Q(Y (A:Z") FM(p,Z”) Yavn |n) (50) 


i.e., explicitely: 


PSQUTT ДЕТ (51) 





The above bound has been applied to a few lattices for different transmission 
rates in bits per two-dimension. Figure 4 presents performance curves which have been 
evaluated for a few known lattices over the Gaussian channel (as well as the perfor- 
mance of the uncoded related systems). In order to compare the performance of signal 
sets, we must use a common criterion for the error rate. Since our bounds concern the 
n-dimensional error probability, we should evaluate the performance of the uncoded 
system taking into account n dimensions. In this event, we have n/2 independent 2- 
dimensional constituent signals (n even), so that the error rate is 


Peine = 1— [1 — Pe Qul" ^. (52) 


Furthermore, the symbol (2-dimensional) error rate for the uncoded system can be 
upper bounded by Theorem 1 so as to allow a fair comparison, that is 


3Yav 


nn 
A 21^. (53) 


Pe (Mun S 1 — [1 - Q( 


CHAPITRE ПІ: Performance of Lattice Codes over the Gaussian Channel 152 


Similarly to (51), the following lower bound is easily derived: 


UWR) 3м , 


Рет) 220 77 PR In). (55) 





We also present bounds on the error rate for the Leech lattice compared with 
experimental results obtained from a commercial modem [19]. As it can be seen from 
Figure 6, the upper bound gives a fairly good agreement with the measured perfor- 
mance of the prototype (within —1.5 dB). Still, the lower bound calculated using the 
covering radius of the Leech packing [18, ch. 23], r= Ya p, is remarkably tight. We 
believe that the tightness of the lower bound (based on the covering radius) may be 
explained by sphere hardening properties. 

Incidentally, it should be stressed that modems based on the Leech lattice 
[e.g., 19] seem to be less attractive than those based on multidimensional Trellis- 
Coded Modulation [e.g. 25-27] owing to the high normalized redundancy (per two 
dimensionsional constellation) of such a lattice [7, table I]. Therefore, although excel- 
lent performance is obtained in the presence of white Gaussian noise, on real 
voiceband telephone channels things could not be so well because other impairments, 
like phase jitter, nonlinear distortion and frequency offset, become more and more 
important as the size of the two-dimensional constituent constellation increases. We 
now turn to the asymptotic behaviour of the lattices as n increases indefinitely. 


PROPOSITION 3. (ASYMPTOTIC GAINS): The fundamental gain of the best lattice 
(covering) A for an arbitrarily large number of dimensions verifies the following 
bounds: 


(A 
Lon EO 1 


21€ on n ле” Рв 


and 


_ eA) 1 
lim —— = —, 
n n ne 


(56.b) 


Moreover, the shape gain for any dimensionality is upper bounded by (Forney et al. 
13,211) 


ле 


6 a (57) 


15 lim y(R)s 
поо 


proof. Bounds (56.а) are an immediate consequence of known bounds оп the highest 
attainable density of lattices for arbitrary large dimensions. They follow from the Min- 
kowski lower bound and the Blichfeldt (or Rooger) upper bound [18,20] and can be 
attributed to Conway and Sloane (|18, р. 20]. These bounds read 
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exp2(—n) S A < exp? (-0.5n) for large n, exp2(x) := 25, where A = V,6 = V,p"/V (A). 
Since y¿(A) = 487", we obtain bounds on y¿(A) by raising the above bounds to the 
power 2/n and multiplying them by 4. This results in 


1/V2" < үдА) < 2/V2". 


But V, = x"? /T(n/2 + 1) so that Stirling’s approximation results in 


se Ә — (58) 


and (56.а) follows. 


Var” 
Similarly, yt (A) = 202". The thickness of the lattice © = V,0 = 70 
the following bounds on the thinnest covering [18, p. 40] for large dimensionality: 


obeys 


ne32 c OS nlnn + nininn + Sn, (59) 


from which we derive 





Un 
AT $0757 Пап tin ln +5, (60) 
n 


resulting in 


2n?^g3^ YA) | 20? ^ du 
E x he ы | (61) 


The asymptotic behaviour for large n is expressed by (56.b), as a result of Stirling's 
approximation (58), which completes the proof. W 


Ш.2.5. BY WAY OF INTERPRETATION 


We remark that although the code gain is limited to about 9 dB at the error pro- 
bability level of 1075-10 [16,21], we see clearly that the fundamental (asymptotic) 
gain is unbounded. Moreover, the equality r?/p?=092"/3% results іп 
г2/р? = 2y*z > 2, n large. We thus have two different topological aspects. We сап 
"feel" a Voronoi region either touching it by the inside (increasing inradius, its max- 
imum value being p) or touching it by the outside (decreasing circumradius, its 
minimum value being r) There is a fundamental discontinuity here: the upper and 
lower bounds (51) and (55) do not converge as dimensionality increases without limit. 

The asymptotic behaviour of lattices can be examined using the following result 
[9]: im 002п In) = 1 or 0 according to whether 22 is less than unity or not, 


respectively. Supposing that the upper bound (56.a) could be achieved, we find that the 
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error probability for lattices with a large number of dimensions goes to zero exponen- 
tially for any rate R < Ro = 1/2 log2(1 + y,,/2). However, this upper bound on the 
best (normalized) fundamental gain was improved by using Kabatiansky-Levenshtein- 
Sidel'nikov results [18, p.20] yielding 0.87176/ne instead of l/ne, which shows that 
even the cutoff rate cannot be attained according to this bound (it is too loose and is 
probably related to the critical rate ?). Constraints should therefore be relaxed in order 
to increase the transmission rate. This gives an additional evidence for the fact that the 
minimum distance criterion becomes irrelevant to very long (ie., very-high dimen- 
sional) constellations [22,23] supporting high rates. 


In contrast, good coverings at large dimensions are such that lim P,(n) = 1 pro- 
vided that R » C, giving some kind of strong converse to the channel coding theorem. 
By allowing partial overlap when packing hyperspheres, we gain more degrees of free- 
dom to construct signal sets and thus more centers per volume unit (higher rates) can 
be achieved. For instance, the decoding rule used in [9] to prove the existence of good 
lattices used as decision regions hyperspheres around each lattice point with partial 
overlap. 


Even with some overlap (a bit less than covering), the error probability can not 
however be bounded away from zero under the sole assumption that R « C [9,24]. 
We guess that the problem of achieving capacity is rather linked to the asymptotic 
normalized thickness for arbitrarily large dimensions than to the asymptotic center den- 
sity as believed by many researchers. 

Now we present in a relaxed and discursive style some heuristic geometrical con- 
siderations on very-high dimensional Euclidean spaces in relation with sphere harden- 
ing phenomena. Let us initially consider a hypersphere of radius a having the same 
volume as a Voronoi region, that is, J,(a) = V,a” = detA. Clearly, p « a « r (p being 
the packing radius and r the covering radius). Let the decision regions be hyperspheres 
of radius s, p <s <a <r, surrounding each lattice point. Of course, these decision 
regions will overlap since 5 > p, but only partially since 5 « г. Therefore 


n 


2 < Th <r. (62) 





p«s 


The asymptotic behaviour for large n can be examined using (58), 
2 < 5 << x 
de? ^A ` det™"A 7 dera ' 








2 (63) 


which gives the bounds Sin < 1/2ле < Ө2"/п, n large. The tightness of the right- 
side bound is essentially due to the sphere hardening phenomenon. Almost the whole 
volume of the Voronoi region becomes concentrated near the surface, so that a « r. 


High-dimensional Voronoi regions behave essentially as spherical ones with radius 
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almost equal to the covering radius. In particular, given an € > 0, there exists n large 
enough such that J,(a) = J,(r — €/2) < J,(r). We know that covering exists such that 
this bound is tight (e.g., those for the best covering). Assume finally that s = a — €/2, 
so that s =r - £ (working a bit less than a covering), then almost surely the received 
point will be found inside the Voronoi region of the transmitted point provided that 
the (hardened) noise sphere is contained in the decision sphere. These ideas agree 
entirely with our previous results |22) and arc illustrated in Figure 7. Interpreting capa- 
city strictly as a "pure" sphere packing problem we should attain Д2" — 1. Now, this 
is far from being true: no packing of hyperspheres without overlap does exist which 
covers the Euclidean space for any dimension n > 1. According to the above results, 
we propose to rather interpret a family of good codes (i.e., those which asymptotically 
achieve capacity) as a family of coverings for which 0?” > 1 (8%”/n — 1/2ле) 
despite the fact that O — oo, 


IIL2.6. CONCLUSIONS AND SUMMARY 


We have presented upper and lower bounds on the performance of communica- 
tion systems based on lattice codes combined with QAM which are a function of con- 
stellation figures of merit. Our aim was to gain insight in the tradeoff. between 
transmission rate and signal-to-noise ratio. We have also shown that lattice coding 
does not shape the power spectral density of the signal with respect to the uncoded 
QAM. Further, an improvement has been proposed on the continuous approximation 
by Forney. Bounds on the best fundamental gain per dimension (due to density and 
covering) have been presented for arbitrarily large dimensions. The chief value we 
would attack is the conjecture that the problem of achieving capacity is connected to 
the asymptotic behaviour of the normalized thickness of lattices. 


APPENDIX: Power spectral density of lattice coded QAM modulation 


Sketch of the proof. Denote by s,(t) the complex envelope of the QAM signal s (г) 
s() = Re (ss) ехр()2л/.2)), (A1) 


+œ n2 
where 500) = Y Y P£” me), Шай) = u (t — mT - EST). 


k=—w m=) 


It can be shown that s¿(t) is a cyclostationary process [28] but we treat it as a wide- 
sense stationary one by introducing a random phase uniformly distributed over one 
block. Therefore we consider a related signal 


Е же п/2 
50 Y Y PÍ"u(9. (A2) 


kz— m=1 
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where Uk m(t, 0) т Uk m(t — 0), Ө being uniformly distributed m the interval (0, 21 


The autocorrelation function (АСЕ) R;,(t,1-1) = Е(5,(г) 3,(—0) of the e 
envelope is 


R;, (t,t) = 


n 
Ж +o œ n/2 D* 2 E * 

LIE P ERP" = Í шна, up. 1,1 -¡(07,8) 4, (АЗ) 
Қ--<е )|ш-<ө =] 0 


where m —1 is taken mod n/2+1. 

We remark first that blocks are transmitted independently so that complex symbols on 
different blocks are uncorrelated, yielding E py” pp; -0, j #0. Furthermore, 
we suppose the sequence of n-dimensional signals is wide-sense stationary and that 
there exists a block ACF 


n/2 
RO= YE (Pe eee), 1201--,a. (A4) 


т-і,тж! 


Therefore, (A3) сап be rewritten as 


Кұ (1-7) = 
IT 
n2 nn mcm a 
TE Y Ere > Í uem(t,®) uhel) 4. (А5) 
Т |2) m=i, mel 0 


By an appropriate change of variables, we obtain 


п/2 ni2 
R5, (1,11) = = X Y E ppm pe J u(a+1-IT)u*(a) da. (A6) 
т=1, тж — 


Putting the above equation in a simpler notation results in: 
R3, (1) = R3, (11-7) = E > E Re) vit — ІТ), (A7) 


where v(t—IT):= | u(a+t- IT) u' (o) da. 


am 
Indeed, R;(0)= Y EJP {™|? = P (Q). Moreover, it follows from lattice symmetry 


т=1 
that Re) =0, l #0. Taking now the Fourier transform of the ACF (A7), we have 
finally that 


5,00- 22 upp = une, (A8) 


so the power spectrum of the pim lattice coded signal follows directly from the 
modulation theorem, 
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$4) = (SLU fo) + 567-7). (А9) 
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Figure 2. Lattice figure of merit times the signal-to-noise ratio required for keeping 
the error rate below 10^-5 as a function of the dimensionality. 
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Figure 4. Bounds on the performance of lattices at several transmission rates in the 
presence of white Gaussian noise. 
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Figure 5. Upper and lower bounds on the block error probability for lattices over an 
AWGN channel: a) Schläfli lattice D4 supporting 1.5 (bits/s)/Hz and b) Gosset lattice Eg 
supporting 3.0 (bits/s)/Hz. 


Simulation results have been obtained by using a trellis decoding (cf. C. Yuan, 
unpublished results, with permission). 
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Figure 6. Block error rate vs signal-to-noise ratio for the Leech lattice. 


The data labelled "commercial modem" concern a 19,200 bits/s modem (7 (bits/s)/Hz, 
2,742.86 bauds) manufactured by Motorola, according to [18] 





Figure 7. Pictorial representation of the signal constellation in Euclidean space R^z, n 
very large. 


Eyesight from a particular signal signal gj. Almost all other signal points 
lie on a hypersphere of radius close to 2a = 2r. The picture does not change if 


the view point becomes the one which represents another signal, for instance si. 
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ГУ.1. PERFORMANCE DU CODAGE-MODULATION POUR LE CANAL 
GAUSSIEN 


Récemment, Battail a montré que les systèmes utilisant un codage du type MDS 
sur un alphabet de grand taille conduisent à une distribution des distances voisine de 
celle que l'on obtient en moyenne par codage aléatoire [BAT ef al. 1990, BAT 1991]. 
Ainsi, les performances de ces systémes peuvent étre estimées selon la technique 
proposée par Shannon [SHA 1949]. On a donc entrepris dans cet esprit une analyse des 
syst&mes combinant codage et modulation, pour le canal gaussien sans ou avec fluctua- 
tions. Ce dernier modèle s'avére fréquemment intéressant, par exemple, dans le cas de 
liaisons radioélectriques perturbées par des phénomènes de trajet multiple et de 
fluctuations de niveau liés à la propagation ionosphérique en ondes décamétriques, aux 
masques et aux réflecteurs pour les ondes métriques et décimétriques en milieu urbain. 


Nous nous sommes intéressé en particulier à l'analyse des performances du cod- 
age aléatoire sur des canaux avec évanouissement de Rayleigh. Dans ce cadre, le 
raisonnement utilisé dans [deO&BAT 1990] a été repris pour étudier le comportement 
asymptotique du taux d'erreur de ces systémes. En présence d'évanouissement, la per- 
formance est évaluée en calculant la moyenne de la probabilité d'erreur pour le rapport 
signal à bruit devenu aléatoire. On a alors pu adapter les théorémes sur le durcisse- 
ment des hypersphéres [p.ex. WOZ&JAC 1965] de Ғасоп à démontrer que la performance 
du code aléatoire sur un canal sans mémoire avec fluctuation tend vers celle d'un 
système sans évanouissement ayant le méme rapport signal à bruit moyen. Comme 
corollaire, la capacité d'un canal avec évanouissement (en supposant l'entrelacement 
parfait) est identique à celle du canal gaussien de même rapport signal à bruit moyen 
[GAL 1968}. 


ABSTRACT 


Looking for systems which combine coding and multilevel modulation whose 
Euclidean distance is close to that which results in the average from random coding, 
we consider the combination of an MDS code over a large-size alphabet and a one-to- 
one mapping of the alphabet into a symmetric constellation e.g., phase modulation. Its 
performance in the presence of additive Gaussian noise can be predicted from that of 
random coding, provided the signal-to-noise ratio is small enough. The results exhibit 
the sphere hardening phenomenon whether or not amplitude fluctuations are present. 
Weighted demodulator output and soft decoding should be effected in order to achieve 
this performance. Such a decoding can be done in principle according to previous 
works by Fang and Battail. A prohibitive complexity can be avoided only at the 
expense of strict optimality. 
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IV.1.1. INTRODUCTION 


Battail was recently led to question the relevance of the minimum distance cri- 
terion when aplied to long block codes [BAT 1989]. As a better criterion, he proposed a 
proximity measure of the code distance distribution with respect to that which results 
in the average from random coding. The criticism of the minimum distance criterion, 
as well as the proposed one, were formulated in the case of the Hamming distance, but 
they are also valid to the Euclidean metric. 


Systems which combine coding and multilevel modulation, e.g., trellis-coded 
modulations to be used over the narrow-band Gaussian channel [UNG 1982], were 
designed for the Euclidean metric which is natural for this channel but they used the 
minimum distance criterion. We found it interesting to consider coded-modulation sys- 
tems whose Euclidean distance distribution is good according to our own criterion. 


Looking for such a system, we first notice that the Hamming distance distribution 
of the maximum-distance-separable codes (MDS), a class which especially includes the 
Reed-Solomon codes, is close to that which results in the average from random coding 
if the alphabet size and the code dimension are large [CHE 89]. In order to define a 
coded-modulation system using these codes, we must define the mapping of the code 
symbols into a constellation. 


Let us consider a system using an MDS code over a large-size alphabet, associ- 
ated with a symmetric constellation of the same size. We are specially interested in the 
case of phase modulation because of its robustness against non-linearities and ampli- 
tude fluctuations. Let first the mapping of the code symbols into this constellation be 
random and vary according to the position in the word. 


The distance distribution of MDS codes and the random character of the mapping 
of the code symbols result in a distribution of Euclidean distances close to that 
obtained using random coding and nonrandom mappping, provided the alphabet size 
and the code dimension are large enough. Furthermore, the Euclidean distance distribu- 
tion is not actually modified if the mapping from the code alphabet to the constellation 
is nonrandom and does not vary with the symbol position. Performance close to that 
of random coding may thus be expected from this fully deterministic scheme (we 
already arrived at a similar conclusion via a different approach [deO&BAT 1990], but the 
coded-modulation system here is completely explicit). Decoding is much less complex, 
however, than if random coding were used. Moreover, in the case of phase modula- 
tion, this scheme easily achieves rotational invariance in order to cope with an arbi- 
trary phase reference, unlike trellis-coded modulation. 
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IV.1.2. A POWERFUL TOOL: THE RANDOM CODING 


Coding here is defined just by taking at random M points in an п dimensional 
Euclidean space which have uniform density probability on the surface of the hyper- 
sphere to which it is confined by the power limitation. The transmission rate per 
dimension is then R = 1/n In(M) nats. The average error probability of such schemes 
on the additive Gaussian noise channel is, according to Shannon [SHA 1949]: 


Pe =1 + f U — e, (07 40,09), (1) 
0 


where 
n is the number of dimensions, 


Q, (8) is defined as the probability that the point which represents the received 
signal is moved by the noise outside a cone with vertex at the origin, whose axis is 
colinear with the transmitted vector and whose half-angle is denoted by 0, 
and 


(0, (0) is the normalized solid angle of such a cone in the Euclidean space. 
In terms of the solid angle of this cone “2, Qq, it is given by 


Or (0) := Q, (0) о, (л), (2) 


where 
8 
Q,(8) = C (n) | sin" x dx, (3) 
0 
and C (n) is an irrelevant constant which does not depend on 0. 


The Riemman-Stieltjes integral (1) can be rewritten as a product of two factors 
depending on the dimensionality: 


т 
P, = 1 — Í F„(R;9) С,(5/М;9,46, (4) 
0 
where 


a) ЕД; := [1 ~ о,(ӨЛМ 71 which is a function of the information rate per dimen- 
sion (nats/dim), 


b) G,(S/N ;0) := —Q',(0) which depends on the signal-to-noise ratio (we notice that it 
is positive). 


(*) The solid angle of a region on the surface of an n-sphere is the ratio of the ares of this region to the (n—1)4h power 
of the radius of the hypersphere. 
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Examining each of these two factors, Battail has shown [BAT et al. 1990] that for n 
increasing without limit, 


: 4211 9 < Өр = arcsin(exp(-R)) 
Jim F,(R 38) = f otherwise, (5a) 
and 
lim G,(S/N ;0) = 5(9 - Өс), (5b) 
nv 


where 6 is a Dirac distribution [BOU 1964] and Өс := arcsin((1 + $IN)y1?, 


Therefore, the average error probability goes asymptotically to 0 or 1 according to 


0 if Өр > Өс. 
f if Op < Oc. (6) 


If Өр > Өс (which obviously implies А < C) then the error probability vanishes. In 
contrast, it approaches unity if Өр < Өс (or R > С). 

IV.1.3. PERFORMANCE PREDICTION USING RANDOM CODING 

Approximations for the First Factor (a). 


The exact expressions for the normalized solid angle of the cone are: 





zd pani "Z? 1, Choro sin[(n-2i-2)0] 
Ф,(0) = z 0 +2 (-1) E (-1) cn n-2i-2 , neven, (7a) 
and 
Ed сау ci 5951-21-20 
1 5 "2-1-2 
@, (8) = > RENE ES , n odd. (7b) 
E CÓ Сһ-2--;; 
і0 n-2i-2 


Interesting approximations are obtained letting Ө = arcsin(x), and considering 
@, (8) = o, ((x)). Taking the first order development of the McLaurin series, we obtain 


F,,(R ;8) = exp Е F г. eno 
n 


F, is a continuous function of x which tends to the unit step at the point x = exp(-R) 


(8) 
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as n increases indefinitely. The transition from 0 to 1 is the more pronounced the 
larger is n. 


For (finite) n large enough, the transition becomes 
5 (n) = arcsin[(2na)! 29D exp(-R (n—1)/n)]. (9) 
so that 


Jim Өр (n) := Өр = arcsin(exp(-R)), (10) 
a result already obtained by Shannon. 
Approximations for the Second Factor (b). 
Shannon has shown that [SHA 1959] 


0,(0) = P (n-1, Үл5/М, Yn-1 cotg0), (11) 
where P (.,.,.) denotes the noncentral t-distribution [KOR&KOR 1968,ABRA&STE 1972], 


that is, 
152 5 
P (m,a,t) =PriZ+ast mer қ (12) 
1 


where 2 and х;, 1 Si S т, are mutually independent Gaussian random variables, with 
zero mean and variance unity; a and f are constant parameters. 
Approximations for Q',(0) can be found in Battail (ibidem). 


We give here another simple approximation for Q,(6), n large, which can be 
derived by taking a Gaussian approximation to the y? -function [ABRA&STE 1972]: 


Yn-1 amus cas: 
n—1cotg [1 amm) np i 


af, , 2000709) 
ЕРТ 
Further, we can take 
09) = 0,09) = 1 - QC'n- IER, (14) 
1 + 0.5 cotg?8 


on the assumption that n>>1 and 0 < Ө < x. Numerical evaluation of Q,(0) is quite 
easy and then we carry out its derivative. 


Q,(8)=1-Q 
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IV.1.4. PRESENCE OF RAYLEIGH FLUCTUATIONS 


In the presence of fading, the performance of the random coding must be 
evaluated by averaging the error probability, і.е. 


P, =: Eg (Pe) = 1-Esin еа 9) G 379) 461, (15) 
where Ес/м(.) denotes the expected value with respect to the random variable S/N. 
Р,-1- І d$ IN | F,(R;0) G,(S/N ;0)P (S/N) d9, 
where 
j? (SIN) dSIN = 1, 


т 
|F„(R;0)| <1, and Í |G, (S/N ;6)| de = 1. 
0 


Changing the order of the integrations (it may be done from the above), we obtain: 


т 

Р,-1- JFq(Rs®) Ем 16,( 5-8) ] de. (16) 
0 

Furthermore, defining G,(p;8) =: Es, (6, 5:6) ], it follows that 

— T M 

Р, -1-(Е,(К;0) С,(р;0) 49. (17) 
0 


It can be noticed that fluctuations affect just the 005-9) term which depends on the 


signal-to-noise ratio. 
d Q,(0) 
49 





Remembering that 6,05: ш- , we find ош 


AUR d 
Gh(p:6) pier Есім [Q4(0) 1. (18) 
The above equation can be rewritten as 
GOD=- e 
-Gr(p;8) = d6 Q,(0) (19) 


where we have defined 
0,0) =: Es 10,00) ] = Es ГР (n-1, VnS IN ,Nn-1 cotg Ө) 1. (20) 
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Here, we shall follow closely de Oliveira-Battail [deO&BAT 1990] in order to 
evaluate the asymptotic behaviour of О,(0). 





In this case, we have yet Q,(0)— P (,.,.) п=21, but the parameter o? = nS/N 
becomes a random variable (r.v.). 


An interleaver is a device that rearranges the ordering of a sequence of symbols 
in some one-to-one deterministic manner. An (n1, m2) interleaver reorders a sequence 
so that no contiguous sequence of nz symbols in the reordered sequence contains any 
pair of symbols that were separated by fewer than пі symbols in the original ordering, 
n; and n3 being relative prime [RAM 1970]. 


We can design an appropriate interleaver to make the channel virtually memory- 
less (i.e. a vanishing correlation between symbols). Therefore, the multiplicative ampli- 
tudes associated with each symbol of a codeword are mutually independent so the 
corresponding probability density P ¿(.) is the convolution product of | = n/2 Rayleigh 
distributions yielding a chi-square distribution with 2/ degrees of freedom. 


Let us first consider some random variable transformations and their related pro- 
bability density functions (pdf's): 





1 Ж 
Рота) = zm lexp(—E2/2p), (21.2) 
IEEE gr 
Р &(n;Ë) TO exp(—E/2p), (21.b) 
t 
P gis (n;5) = те Ді exp(-I5/p), (21.c) 


where Py (E)=P (X SE) is the pdf of the r.v. X. 
Indeed, p denotes the average signal-to-noise ratio as we can see by taking 
Еа?) = | EP „(п;5) dé = j EP o (n36) dé = np, Q2) 
so that 
En) =np or ЕЎ) = р. (23) 
In order to evaluate the (average) error probability, we need to average 


О.) = P (n-1,0, n-1 cotg@) with respect to the random parameter о, as mentioned 
earlier. This can be carried out alternatively by: 


0,09) = [P (n-1,€, n-1cotg8) P .(п:2) dE, (24.2) 
0 
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=SP (n-1, VE, Vn-1 соғ) P a? (n;E) d£, (24.b) 
0 

z[P (n1, Yn& Vn—1 cotge) P (nt) dt. Q4.c) 
0 


"We shall consider the following set of functions: 


Qa(n;5,9 -Р(п-1,Е, Үл-1 cotg0), (25.a) 
Qii(n;E,8) = P (n-1, VE, Vn-1cotg8), (25.b) 
Quis (n55,9) = Р (n-1, YnE ,Yn—1 cotg0), (25.c) 
so Q,(0) can be rewritten using the above definitions, yielding 
0,6) = 10.(в:5,0) P a(n;E) dé = Eal Qu(n;5,9) ), (26.a) 
0 
=fQ (n:6,0) P g2(nst) dé = Eo? [ Qui (5,9) ], (26.b) 
0 
-] Оо2п(п;5,0) P охл (п 6) dE = Egtis Qotin(n 5,0) 1. (26.с) 


Again, Ey[.] denotes the expected value with respect to the r.v. X. 
We will need the two following theorems (see [deO&BAT 1990] for proof): 


THEOREM 1. (Weak-law theorem). 
Let 02 = nS/N be a random variable with distribution given by (21) where p is the 


average signal-to-noise ratio. Then plim (Se, that is, for any positive real £20 we 


have lim Р(5-р| 20-0 Ш 


THEOREM 2. 
The sequence of functions [P о2,„(л jS defines a Dirac function 8(E-p). Ш 


Now, we intend to prove that the presence of Rayleigh fading does not change 
the performance with respect to a constant signal-to-noise channel, provided the 
dimensionality increases without limit, a known result [GAL 1968]. 


THEOREM 3. The performance of the random code on a memoryless Rayleigh fad- 
ing channel tends, as dimensionality increases, to the performance of a system with no 
fading and the same mean signal-to-noise ratio. Ш 
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proof. Taking the limit when n increases indefinitely in (26.c), we obtain 


lim Q,(9) = lim Eqn [Оо2„(п;5,0) 1. (27) 
n- no 
On the other hand, it follows from theorem 2 that lim P 2, (n;5) = Ô(E-p), so that 
lim 0,(6) = Оо2„(п;р,Ө) = 0,(0) | | (28) 
noo Ss zp 
N 


Applying this in (19), we have 


limG,8-G, 9|. . Q9) 
ne N S. 
w^? 
Finally, substituting (29) in (17) it follows the claimed result, P, =P, P А 
WP 
Q.E.D. 
COROLLARY. 


The capacity of a memoryless Rayleigh-fading channel is the same as that of a Gaus- 
sian channel with the same mean signal-to-noise ratio. MI 


The numerical results obtained closely agree with theorem 3. 


IV.1.5. CONCLUSION 


It is known that MDS codes are good. It is our opinion that they are still better 
than currently believed and that, when combined with a proper multilevel modulation, 
they can behave very similarly to random coding, thus closely approaching the capa- 
city of the channel. The key to their efficient use is weighted decoding since it can 
approach maximum likelihood decoding which chooses the signal point closest to the 
received one according to the Euclidean metric. Complexity can be kept reasonably 
small only at the expense of strict optimality. 
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IV.2. THE RANDOM CODED MODULATION: 
PERFORMANCE AND EUCLIDEAN DISTANCE SPECTRUM EVALUATION. 


LE MOT MAGIQUE 


Dans un espace à trés grande dimension 
habitent des milliers de bits d' information 

à des années-lumiéres de distance euclidienne 
noyés par le bruit d'une mer gaussienne 

des petits points tels qu' étoiles brillantes 
transmis à un rythme hallucinant 

(quoique contraint par la capacité rayonnante) 
exhibent des taux d' erreur extravagants 

mais bornés par une exponentielle dominante ... 
O univers de constellations omnipotentes! 

un peu partout, des voix quasi omniscientes 
tantót crient tantót murmurent, redondantes, 
un mot magique, le nom "Shannon" ... 


Deux concepts ont principalement été exploités dans ce chapitre: le raisonnement de 
Shannon utilisant le codage aléatoire et la critique du critère de distance minimale 
revendiquée par Battail. J'ai proposé d'appliquer à la modulation codée le célèbre 
raisonnement du codage aléatoire. On considère d'abord une constelation multidimen- 
sionnelle non codée créée par la concatenation de N/2 constellations bidimensionnelles, 
c'est-à-dire N/2 fois le produit cartésien d'une constellation constituante par elle-méme. 
Alors, une constellation aléatoire est construite en choisissant au hasard un certain nom- 
bre de signaux, inférieur au nombre total de signaux disponibles, dans la constellation 
multidimensionnelle non codée. Une borne simple sur la probabilité moyenne d'erreur a 
été obtenue par la bome de la réunion. L'idée d'un débit critique partiel (en fonction de la 
dimensionnalité disponible) a été développée. Ensuite, j'ai introduit le concept de série 
théta pour les constellations bornées qui généralise les séries théta connues pour les 
réseaux. J'ai développé des bornes de la probabilité d'erreur par bloc et par symbole, 
basées sur la fonction de transfert du jeu de signaux employé. Ces bornes ont une forte 
analogie avec les bornes de la probabilité d'erreur des codes convolutifs introduites par 
Viterbi [VIT 1971]. J'ai ensuite étudié les caractéristiques de la distribution euclidienne des 
distances. L'évaluation de paramètres tels que la moyenne et la variance du carré de la 
distance a encore pu étre faite à l'aide de la fonction de transfert. Les spectres de distance 
de quelques constellations multidimensionnelles aléatoires ont été obtenues dans le cas de 
constellations constituantes carrées ou en croix. J'ai mis en évidence un phénoméne assez 


This work was presented in part at the Int Symp. on Info. Theory, Budapest, Hungary, June 23-28, 1991. 
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intéressant (ce que j'appelle le durcissement de 1а distance normalisée) de concentration 
des valeurs du carré de la distance euclidienne autour de sa moyenne. Cela montre que la 
distance minimale n'est pas importante dans le cas d'un grand nombre de dimensions, 
mais plutôt la distance moyenne. Les critiques faites dans le cas du codage classique [BAT 
1989] se généralisent donc aussi dans le cas de la modulation codée. Ces résultats rejoig- 
nent clairement l'idée de Battail. Enfin, j'ai démontré de méme que l'énoncé "tous les 
codes sont bons" est verifié aussi pour la modulation codée. En fait, excepté pour un 
ensemble de mesure nulle, toutes les constellations présentent une probabilité d'erreur 
aussi petite que l'on veut quand le nombre de dimensions de 1а constellation codée tend 
vers l'infini. 


ABSTRACT 


We apply the random coding argument to coded modulation. The well-known union 
bound on the error probability of general signaling schemes is revisited. The random 
coded modulation idea is introduced and a simple bound on the average performance of 
coded constellations is presented. A relationship between the union bound and the cut-off 
rate is exhibited by introducing the concept of N-dimensional partial cut-off rate. We 
define finite theta series for bounded finite-dimensional constellations and their related 
transfer functions. Bounds on the block and symbol error probability are developed which 
are based on the transfer function. The discussion is then focused on the squared 
Euclidean distance distribution. The evaluation of such parameters as its first two 
moments (average squared distance and squared distance variance) is considered by 
either finite theta series or transfer function of the bounded signal set. The Euclidean dis- 
tance spectra of a few multidimensional coded modulation schemes based on square/cross 
constituent two dimensional constellations are presented. Their respective partial cut-off 
rates are computed. Finally, we discuss the asymptotic behaviour of very long coded con- 
stellations. 


IV.2.1. INTRODUCTION 


ONE of the deepest ideas of coding theory is the random coding argument introduced by 
Shannon [1]. On the other hand, many efficient coding techniques have been developed 
much later using the famous idea of coded modulation by Ungerboeck [2]. In this paper 
we intend to amalgamate these two concepts: random coding is combined with 2- 
dimensional modulation e.g., Quadrature Amplitude Modulation (QAM), in order to 
investigate the average performance of multidimensional coded constellations. We were 
in part motivated by the fact that some extremely regular codes appear to mimic the ran- 
dom code [3,4]. 

Ап upper bound on the average error probability of random coded modulation is 
presented in section IV.2.2. It derives from the union bound and leads to the definition of 
a partial cut-off rate, where "partial" means here that this quantity does take into account 
the actual number of dimensions. Following, we define finite theta series for bounded 
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multidimensional constellations and their related transfer functions. An interesting bound 
on the N-dimensional error probability of coded constellations is developed which is 
based on the transfer function and can also be applied to lattices. These bounds present a 
strong likeness with those on performance of convolutional codes earlier introduced by 
Viterbi [5], and they are also related to those on the trellis codes performance by Zehavi- 
Wolf [6]. 

In section IV.2.3 the distance spectra of multidimensional random coded constella- 
tions are investigated and examples are given. Parameters like the average squared 
Euclidean distance and squared distance variance of the distance spectrum are evaluated 
in terms of either the finite theta series or the transfer function of the constellation. The 
distance distribution is calculated for some multidimensional constellations based on 
square/cross constituent 2-dimensional (2D) constellations. Further, we prove that an 
interesting phenomenon occurs, namely a normalized squared distance hardening, which 
Shows that the average squared distance becomes dominant on the error rate for high- 
dimensional constellations. This result confirms the fact that minimal distance is not 
significant for long codes [7-8]. It may also be related to our recent finding that lattices 
exist which can achieve the channel capacity [9]. We develop in section IV.2.4 upper 
bounds on the symbol error probability still based on the transfer function of the signal 
set. 

Finally, the behaviour of very high dimensional constellations is investigated in sec- 
tion IV.2.5 and we prove that almost all coded constellations become good as dimen- 
sionality increases. Besides, we show that almost all coded signal sets tend to become 
quasi-identical in a sense to be specified later. Section IV.2.6 provides a summary and 
concluding remarks. 


IV.22. BOUNDS ON THE ERROR PROBABILITY AND THE PARTIAL CUT-OFF 
RATE 


The noise will be considered to be additive white and Gaussian (AWGN) with a double- 
sided spectral power density o? = No/2 (Watts iHz dim. Also, we adopt the symbol := to 
denote equals by definition and exp? (x) will denote 2°. 


THEOREM 1 (UNION BOUND): The error probability P,(N) of an N-dimensional con- 
stellation with M equally likely signals over an AWGN channel is upper bounded by 


dux 
PN) S4 Y, Nyy(d?) efc N EL y) 
dud P(C) 


min 
where Yav=E av/N o is the signal-to-noise ratio, 

P (C) is the average normalized power per 2-dimensional symbol, 

Nav (d?) is the average number of signal pairs with squared Euclidean distance d A 
proof. Let {S0,S1, 777 , Sm-1} denote the signals of a (coded ог uncoded) N- 
dimensional constellation. Since s; is a point in an N-dimensional space, it can be written 
іп terms of its coordinates, that is, 5; =(S;1,5;2, 777 > SiN-1,Sin). The squared Euclidean 
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distance between two signal points, 5; and s;, is given by 
N 
d*(s;, s) Хабар). (1) 
k=l 


On the other hand, the error probability Р,(М) of an N-dimensional signal set сап be 
evaluated by 


M-1 1 HA 
РАМ- Y,PGOP(els)- a, Х Pe |5) (2) 
іт) ішО 


where P (5;) is the probability that s; is transmitted, and 
P (e |5;) is the conditional error probability. 
In order to calculate the conditional error probability given that the signal s; was transmit- 
ted, we shall consider an index set Т; := (je 0,1,...,M -1 | j 1). Certainly, an error is 
made iff the decoded signal s belongs to the error set E; := {I s; | j & i). 
j 


Hence, 


P(e |s) =P (dec se E;) =P (dec se U sj) (3) 
g m 7 јет, 
where (dec s) denotes the event "decoding the signal s". For simplicity, we dropped out 
"given that s; was transmitted". 

We can make a partition of the index set T; according to the distance between 5; and 
the elements whose index belongs to the set 7, Іш I i= 
(je0,1,2,....M-1 | d?(s; , sj)=d?} be such a partition of T; Then Т/с Т; and 

U тё =T;. Furthermore, Tin TË = Ø for d # d', Ø being the empty set. This parti- 
dad min 
tion over the index set induces a partition over E; which is given by the following subsets: 


B= {sj 14?(5,5) 2d?) 2 Y sj (4) 
j деті 
in such a way that Ed Ef =D ford e d. 
аљ 
Applying these partitions, the error set E; can be rewritten as E;= U U, Sj 
dud, jeT, 
Consequently, it follows from (3) that 
2 d 
P(e | si)=P(decse U U, 5/25) 6) 


dF nin JET; 
where 5;-95; denotes the event of decoding s; when 5; is sent and s; is considered as the 
only alternative. The use of the union bound (see e.g. [18], p.60) to the above equation 
yields: 


Plelsps Y У Р(5;-5) (6) 
dmdan JET, 
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where P (5;-Э5;) denotes the pairwise error probability when 5; is sent and s; is the only 
alternative. It ‘should be pointed out that P (s;5;) for je T? does not depend on j but just 
on d? . Moreover, it can easily be shown that 


PCs) eerte D) = VÀ ere льо) (7) 


where the second equality results from the equality Yay = Eav/N o = P (C)/20?. To sim. 
plify notation, the pairwise error probability of any two points i,j with square distance d % 
will be denoted throughout by e(d 2) ж. erfc(Vad? ), where a := Yay/4P (C). 

Now, let N;(d?) = | T? | denote the cardinality of the set ri, ie., the number of sig- 
nals at a squared Euclidean distance d? from 5j. It results from equalities (6) and (7) that 


d maz 
P(e |s)S Y №?) e(a?). (8) 


A ma 


Therefore, inserting into (2) we find 


M-1 
Pe(N)S T > = ма?) e(d?) . (9) 
i=0 dud 


Finally, the proof is completed by changing the order of the summations and defining 
M-1 
Nu): 7 Y NP) (10) 
i-o 


which represents the average number of points at a distance d ? in the signal constellation. 
Q.E.D. 

Indeed, this theorem applies to both coded and uncoded constellations. As a simple 
example, we consider the uncoded M-ary 2-dimensional constellation ir a to 


narrow-sense QAM. Assuming a high signal-to-noise ratio (———— Yav > 1) and 


P (C) 
remembering that d min = 2 and Nay (din ) 2 4 (for large M), we derive the well-known 


approximation of the symbol error probability: 


din /4 av 
Pe) = A Ns dle Fo ee? et E 5920 ай 


In the following, we apply the famous random coding argument to coded modulation sys- 
tems. 





Random coding 


Let us consider, to begin with, an N-dimensional uncoded constellation (N even) created 
by concatenating N/2 identical 2-dimensional constellations whose alphabet size is q, i.e., 
by taking the Cartesian product of a constituent 2-dimensional constellation with itself 
N/2 times. From its total number of uncoded signals Mu =q*?, we build an N- 
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dimensional random coded constellation by a random (uniform) choice of M cod = qE Е 
points, (М coq < М ше), resulting in a rate of 


R= 7108: M os = #08: bits/dim 12) 


or a normalized rate [10,11] of R = (K/N) log; q bits per 2-dimensional symbol. 

The way of introducing redundancy by increasing the alphabet size is the same as in 
Ungerboeck's work. This coding technique could be seen as a Block Code Modulation 
(BCM) where 4-агу (N,K) block codes are picked at random. Additionally, it should be 
pointed out that this process deals with the ensemble of all codes and that no linearity 
assumption is made. By an abuse of language, a coded constellation is referred indis- 
tinctly to as a code. Henceforth, we denote by О an N-dimensional constellation while its 
constituent 2-dimensional constellation is denoted by £25. Also, the minimal distance іп 
the constituent 2-dimensional constellation is denoted by do. 


Now the idea of random coded modulation is used in connection with Theorem 1 
(union bound) in order to estimate the average error probability of the set of all codes. 
This is made according to the following theorem: 


THEOREM 2. (RANDOM CODING): Let P,(N) be the average error probability of a 
random coded modulation with an N-dimensional signal set. Then the following inequal- 


ity holds: 
PW) S% Y, Kod?) eto rom 
dad 


min 
where N,, (d?) denote an average unnormalized squared distance profile. 


proof. We deal with L codes chosen by random means as suggested earlier. Applying the 
preceding theorem to each code, the following set of inequalities results: 


PÉUN)S Y Na (4^) ed?) (13.1) 
а=. 

PPQN)S Y, маз) «а? (13.2) 
dud, 

PÉUN)S Y, Nata?) ea’). (131) 
dd us 


the superscript #/ standing for the /-th code. We note that these codes have not the same 
minimal distance. We use here the minimum of the minimal distance among all conceiv- 
able codes, namely dy. Furthermore, there are at most M cod (M co4—1) terms in each sum. 
Thus, the mean error probability of random codes can be expressed as 


БАМ)= lim LS Pe. (14) 
: Le Lie s 
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Thus, it results from equalities (13.*) that 


PAN)S Y, Nota?) eld?) (15) 
dad min 
where 
= L 
Nay(d?) = lim 25 Na?) (16) 
Lo» L HS 


is referred to as the unnormalized squared distance profile of the random code. 
Q.E.D. 


It should be stressed that Nay(d 2) is not the squared distance profile of any code of the 
random ensemble but rather the average profile resulting from taking into account all 
codes. Strictly speaking, there is no code among all existing codes whose profile is 
Nav(d 2), Now we introduce а normalized squared distance profile referred to as 'squared 
distance distribution'. 


DEFINITION 1. The squared distance distribution (distance spectrum) of the uncoded 
and random coded constellations are respectively 

Р( )une = Nav(d?)/Mune and P(d?):=N,y(d7)/ M cod 
N av(d 2) standing for the distance profile of the uncoded N-dimensional constellation. 


Evidently, one has xq?) = 1 in both cases. The way to evaluate М,,(а2), and 
consequently to estimate the average performance, is quite simple. 


ASSUMPTION 1. We consider that the N-dimensional random coded constellation has 
the same distribution as the uncoded N-dimensional signal set, that is to say, 
P (d?) =P (d? Jane. 


Ал immediate consequence of this assumption is 
М.Х?) = q-9 XN , (d?) = exp; (-N [Vlog;q-R]) Nav(d?). (17) 
We intend now to show that this union bound is closely linked to a cut-off rate R 0 so that 
these bounds are useless both near and above Ro. 
THEOREM 3. (PARTIAL CUT-OFF RATE): The average error probability of an N- 
dimensional random coded signal set is exponentially upper bounded by 
PAN) < exp? (-N[Ro(N)- R]) 


where R o(N) 2 -UN log;E[ e(d 2) is the N-dimensional partial cut-off rate. 


proof. Of course, the average error probability is upper bounded according to Theorem 2 
which can be rewritten as 
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BAN) exp (-N [log y, Nod?) ed?) . ав) 
da. 
Besides, a reliability function, namely E (RR o), is defined as 
E(R,Ro):=-1/N log Y, N,, (d?) eta?) (19) 
dud min 


so equation (18) can be expressed in the form 


P, (N) < exp; EN E(R,Ro)]. (20) 
Remembering that M coa = exp; (NR), R in bits/dimension, we put 
= М.а?) 
Е(В,Ко) = — vlog, (expa(NR) Y, ——— ead?) (21) 
ата ы Мс 
yielding 
E(R,Ro)=[-1N log; Y, P(d?) e(d?) - R. (22) 
dad min 
We now define the N-dimensional partial cut-off rate as 
RoN) :=--LlopE [4 ен d aul bits/dim. Q3) 
N Pi" 


where the expectation is taken with respect to the distribution Р(а2), the term P(0) not 
being taken into account. This leads to E(R,Ro) = Ro(N) - К and the proof follows. 
Q.E.D. 


DEFINITION 2. The cut-off rate, Ro, is related to Ro(N) by Jim RoW) := Ко, where 
а = оо 
both Ко(М) апа R аге expressed in bits per dimension. 


It should be pointed out that Theorem 3 can be used for a particular code (coded 
constellation) as well as for the random code: it suffices to apply Theorem 1 instead of 
Theorem 2 in its derivation. Hence, an interesting way to compare different codes is to 
calculate their respective partial cut-off rates, i.e. for the / % code: 


RË (N) = - ов y P#(d?)e(d?). (24) 
did. 


The evaluation of such partial rates involves the knowledge of the complete distance 
spectrum which is, to some extent, hard to obtain. Hence, we consider two special rates 
related to the partial cut-off rate: 


Еа := - ов e(d2); (25) 


the subscript m standing here for min or mean. In the latter case we define 
d mean ‘= [E (d? )]! 7. The rate Ro(N) can be estimated by the following theorem: 
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THEOREM 4. For any dimensionality N, the partial cut-off rate verifies the following 
bounds: RoN min SRN) S Ко) а 


Sketch of ће proof. To prove this, observe that the first bound is ап immediate conse- 
quence of erfc(.) being monotonically decreasing with d 2 and that the second опе can be 
proved by Jensen's inequality. Q.E.D. 

When N is large enough, the asymptotic behaviour of the R o(N) bounds expressed 
in nats/dimension is given by 











RoW min = y 4P (C) and = Ro(N)mean ~ М APO (26) 


In order to compare the performance of uncoded and coded constellations, we must use 
the same criterion for measuring the error rate. The probability of error of uncoded con- 
Stellations are currently expressed per 2-dimensional symbol, so the following lemma 
could be useful. 


LEMMA 5. The 2-dimensional error probability of symmetrical constellations (like lat- 
tice or randomly coded ones) is related to the N-dimensional error probability by 


wre ) SP ¿(2) S P,(N). 
proof. The рое error rate is expressed as 


PAN) = =P error in the i-th 2D symbol) 5 I Р.(2) = — X PA) ; (27) 


іт] 


where we have used both the union bound and the constellation symmetry. Furthermore, 
the 2-dimensional error probability can be evaluated by 


P.(2)= E[number E m per ND] (28) 


the word "error" standing here for "erroneous 2D symbol". The average number of errors 
can be expressed as 


Na 
ЕП errors per ND] = I i P (i errors per ND) 5 га > P(i errors per ND). (29) 
izl 
Additionally, 
N/2 
Р.(№) = =P i errors per ND) = Y P (i errors per ND). (30) 
іші ізі 


The proof is completed by combining (29) and (30). Q.E.D. 


It has long been recognized that good multidimensional coded constellations can be 
obtained using dense finite-dimensional lattices. A lattice code {2 is defined here as a sub- 
set of a lattice A whose points lie within a bounded region [12]. Clearly, the dimension of 
a lattice code is the same as that of the taken lattice, that is, dimQ - dimA. Тһе Ө series 
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of an (unbounded) lattice A is given by [12,13] 


c uiis gt e ГР. 
Өл) = Y №42) и =1+ Y, Ма)» G1) 

d=0 dad mn 
where w = exp(riz) (i = V-1) and N (d?) is the number of lattice points at a squared dis- 
tance d? from the origin. Further, we suggest to define a finite theta series of a bounded 
lattice Q according to 


DEFINITION 3.(FINITE THETA SERIES) 
ds das 
9a): Y, Nu?) w^Z =1+ Y Ny(d?)w? 
d=0 dd mia 
where w = ехр(ліг) and N ,, (d?) denotes the average number of points at a squared dis- 


tance d? from an arbitrary point, as defined in Theorem 1. 


The total number of constellation points is M = |Q|, the cardinality of the set О. 
This function contains all the information concerning the average neighbourhood in the 
constellation. We mention that finite theta series, as defined above, can be employed not 
only for lattice codes but also for any bounded signal set. 


PROPOSITION 6. The finite theta series verifies the properties: 


deus 
Galve = X N,(d?)2M-|Q| and im On(z) > Өле). 
d= 22” 


Indeed, the bounded lattice (2 approches the lattice A when M increases indefinitely. It 
can be seen that N;(d DN (d 2 ) becomes independent from i as Моо, and that 
М,,(42)-М(а2). 

А bound on the performance of lattice coded systems can now be developed which 
is based on theta series and Theorem 1. In fact, we use transfer functions which result 
from the theta series (either infinite or finite) by a change in its indeterminant. А some- 
what strong analogy is found with bounds on the convolutional codes performance by 
Viterbi (5). This bound is attributed to Forney in [13], p.73. 


LEMMA 7. The N-dimensional error rate of a coded constellation (2 taken from a lattice 
A is upper bounded by 


PeWN)la S'AT(Q ;)|p-p, S ATDA lD, 
where T (D ; . ) are the transfer functions defined below and Do := exp(-a dà), do being 
the minimal distance of the uncoded constituent 2D constellation. 
proof. Consider the A-transfer function, T(D) 0 « D « 1, of alattice A defined as 


dou 
тФ:\= X маур®ё e| yg -1. (32) 
ded as w=D 
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Similarly, the Q-transfer function of a lattice code Q is defined by 


а. 2 
TD;Q: Y Nwa) DËS = @g@)| pg -L (33) 
dud, мар 


On the other hand, the exponential bound on the erfc(.) function (*) results in: 
2 
erfc(Yad? ) < ехр(-а42)- D "da [рар, - (34) 


Applying this inequality to the upper bound of Theorem 1 readily results in the (weaker) 
bound 


а 2 
PIS Y Nod) DiE [pep = АТФ:0)ь,. 869) 
dzd min 
Furthermore, since М,,(42) < М(42), it is easily verified that (YD) T(D;Q) $T(D;A), 
completing the proof. Q.E.D. 

The bound on the error probability based on the A-transfer function is less tight than 
the one based on the (2-transfer function, but is is quite straightforward to obtain. More- 
over, it can be improved in the following way: a truncated transfer function T (D ;[A]) of a 
lattice A is defined as 


TDA) = TRUNG aaa) ug — 1 (36) 


where TRUNC indicates that the © series written as a polynomial of w has been truncated 
to a finite degree but no less than d2,,. Thus, possible convergence problems are 
avoided. In the cases where d max is unknown, the theta series may be truncated to the 
minimal degree greater than or equal to №2 Мах d?, where S = A(Q)) denotes the set of 


all conceivable squared Euclidean distances between two points in a constituent 2D con- 
stellation. As a consequence, 


^ T(D:$)|p-p, SATO (A) pap, S'AT(D;A)lp=p, - (37) 


* Of course, other bounds could be used here 


CHAPITRE IV: The Random Coded Modulation 186 
IV.2.3. EUCLIDEAN DISTANCE SPECTRUM OF RANDOM CODES 


Besides the minimum squared distance, we are especially interested in the first and 
second moments of the Euclidean distance distribution P (42), denoted respectively by 
Е(а2) and E([d?]). The next lemma presents some interesting properties relating 
these parameters to the theta scrics of a constellation. 


LEMMA 8. The average and the variance of the squared Euclidean distance of a con- 
stellation Q, respectively E (42) and o?(d?), are given by 


























2 
2,_ 10206) 22,, 1 |9006), 4Өс(г) 
pu yen ^ de T s CE e da? dw J| 
proof. First, we notice that 
de а а 
aC) = Y М,,(а2) а? 1-1 2|o| Y Pda (38) 
dw 
w=1 d=d ain d=d min 
and the first part follows. 
Furthermore, 
d^?Og(z) dns 2 
5] = E Маза @?-1) 147 (39) 
dw wal d-d min 
which can be arranged as 
d?Og(z) 
— | = |0] Р р (4242 - y Paya) (40) 
dw" |, din d=d min 
proving the second part. Q.E.D. 


Lemma 8 can be rewritten in terms of the transfer function of a bounded lattice 
as 


COROLLARY 9. The first two moments of the distance distribution P (d?) are given 
by the formulae: 


dé dT(D;Q) 





E(d?) = 
Ia Ф jy. 
and 
d$ | dr(D;Q) dT (D;Q) 
2234. C9. 2,32) LN. 
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Besides transfer functions we are also concerned with related functions given by 


DEFINITION 4. (COMPLETE TRANSFER FUNCTION) the complete transfer func- 
tion, namely Ty (D), of an N-dimensional lattice А (ог an N-dimensional bounded con- 
stellation £2) is defined as 


T. (D) = 1* T(D;g) = Ө, €) ри 
where р stands for A or Q. 


It is clear heretofore if the complete transfer function concerns either a lattice or a 
bounded constellation. 


For the multidimensional uncoded constellation specified earlier, it can be seen by 
a combinatory approach of the generating function [14] that 
Ty (D) = ITD"? . (41) 


Taking random coding into account, the complete transfer function TN(D) of such a 
multidimensional constellation is given by 





Ty(D) = wm TND) = 4-2 Ty (D) (42) 


which is an immediate consequence of  Assumption 1. Also, obviously, 
Ty(1) = [T2(D0] 7? = 42 and Ty(1) = 42, as expected (see Proposition 6). 

We are interested in the squared distance distribution (spectrum) of the random 
coded-modulation, P(d?) so we will use Corollary 9. Initially, we calculate the 
derivative of the complete transfer function. Henceforth, for the sake of simplicity, we 
denote dT (D)/dD by T(D). 


In) = ^. (72). 1:0) (43.1) 
and 
TWD) = ШЕ MO. MO + (MO. hoy (43.2) 
Now, we are able to establish the next result: 


THEOREM 10. The mean and variance of the squared Euclidean distance between 
two points of a multidimensional random coded constellation are, respectively 


T (1) 
Ea?) = d Е І | TD | 





and 


TD, T4) | 
TAD 7:40) 














TAD | 


d 4 N 
c? (d?) = d$ 3 T4) 
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proof. By Corollary 9, we have (the second equality results from Assumption 1): 














2 атм) d$ а Ty(D) 
Е4%--ұ TD | =- N2 ар | : (44) 
m 4 ШІ» sg 
Substituting (43.1) in (44) and remembering that T2(1) = q, it follows 
d м TO 2М Ta) 
а Аа аЬ 45 
E(d*) DUC TD T4(1) = 4 2 © TU) (45) 
The second moment is given by 
d$ | а?ту(р dTy(D 
E( [d2}? )= V LT + TND) (46) 
q D=1 D=1 
> au : 
= тит Dh + Tw]. 


Combining (43.1), (43.2) and the above equation, we find out after further 
simplifications 


TADO м mM? 7:0) 


—— ———— 4 
+O may * Ta oe 


ama M 
EC1)7 d [ray * 2 


We get the desired form of the squared distance variance by inserting (47) and (45) 
into 02(42) = E([d?]?) — E?(d?), which completes the proof. Q.E.D. 


Examples 


We intend to apply the above results to a number of multidimensional random coded 
constellations. To begin with, let us consider a few constituent 2-dimensional constel- 
lations with alphabet size 4 - 4, 8, 16, 32 for example (figure 1). Next, we evaluate 
the finite theta series as well as the transfer function of such signal sets (cf. Appendix 
A). The respective transfer functions are presented below. 


T2(D) = 1+2D + 1D? 

T2(D) = 142.0D+1.5D?+1.0D*+2.0D%+0.5D 1 

T2(D) = 143.0D+2.25D?+2.0D*+3.0D5+1.0D*+1.0D9+1.5D*%+1.0D3+0.25D 8 

T2(D) = 1+3.25D +2.875D?+2.5D4+4,5D5+1.75D ®+1.75D 9+3.25D °+2.5D 341D 1642p 174 
+0.875D 18+1.5020+1.50225+0.75р 7540.50 9 +0.25D *2+0.25D™ . 


One has T;(1/T2(1) = 1, 3, 5, 10, --- for q = 4, 8, 16, 32, “>”, respectively. 
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A simple, but striking, example of our approach makes allowance for an N- 
dimensional coded constellation with constituent 2-dimensional signal set of size 
|9;| = 16. Then 


T4(D) = 143D1«4225D?42D^43D5 41D 541D? 1.5D 9 1p 340,25D 1? 
T4(D) = 344.5D48D?415D 48D? 49D5 15D? 13D 1244, 5p !7 
T4(D) = 4.5424D?460D? 56D $+72D 7+135D 8+156D 11 476.5D 16 


so that 72(1) = 16, T2(1) = 80 and T4) z 584. 

Hence, assuming do = 2, the distance spectrum is mainly characterized by: 
E(d?) = 5N 2 and 0*(d?) = 165 М/2. 

Plots of the distance spectrum for a few dimensions are exhibited in figure 2. It 
can be seen that their respective distributions clearly approach a Gaussian one as the 
dimensionality increases. 


When the dimensionality increases, there is some kind of squared distance con- 
centration near the average distance, since the squared distance spread (relative to the 
mean) tends asymptotically to zero. More precisely: 


THEOREM 11. (NORMALIZED DISTANCE HARDENING): Тһе squared Euclidean 
distance of multidimensional random coded constellations verifies 


ü а? _ 2 T2(1) h lim de the limit i babili 
plim wh = 4% TU where plim denotes the limit in probability. 


proof. We first define a variable 8, namely the 2-dimension distance (or normalized 
distance), according to 8? := d?/(N /2). Clearly, 0 < 8? € deg T2(D). It follows from 
Theorem 10 that 
2 2 2 dj . Kı 
Е(82) =d .K; ша  co?*(8)2 ——— (48) 
М/2 

where K, апа K are, respectively, the two terms into brackets in Theorem 10. Thus, 
Chebyshev's inequality results in 





dj.K 
2 _ 2 0-22 
Р (|8 – E(6*)| > е) < NA € 20 (49) 
which goes to zero as N increases indefinitely. Q.E.D. 


Roughly speaking, this theorem asserts that М(Е(82)) = М(1- 0(1)) for very high 
dimensionalities (Landau notation). Thus, there exists very few long coded constella- 
tions for which the normalized squared distance exeeds the "hardening distance" by 
any appreciable margin. А similar behaviour has been found for the minimal (Ham- 
ming) distance in the ensemble of binary codes having fixed ratio K/N [19], namely 


PS -p| >E)—0 as N>% 


where d is the minimal Hamming distance, H2(p) := —-plogap - (1-p)log2(1-p) is the 
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binary entropy function and p is the smallest solution of 1—H 2? (p) = K/N. This asserts 
that very few long codes exist lying far from the Varsharmov-Gilbert bound. Now the 
partial cut-off rate can be written as R o(N) = -UN log; ЕТ 1/2 erfc( Va82N /2 Jl. 

It can be seen ex post fact that the average squared distance becomes dominant 
on the error rate performance as dimensionality increases. Thus, the minimal distance 
is not significant for long codes. This meets the recent criticism of the minimal dis- 
tance criterion by Battail [7-8]. 


IV.2.4. MORE ON THE ERROR PROBABILITY BOUNDS 


Naturally, the upper bounds so far introduced concern the N-dimensional (block) error 
probability. We are also interested in obtaining upper bounds on the random coded- 
modulation performance on the basis of the 2D error probability criterion (symbol 
error rate). To this end we introduce a second variable L in the complete transfer func- 
tion, namely: 


DEFINITION 5. (TWO-PARAMETER TRANSFER FUNCTION): 


dan NA айл 

T(D,L;Q): Y Y Nata?) DL 
dzd,,l71 

where Nay(d?,1) is the average number of signal pairs with both squared distance d? 

and / different 2D symbols. 


An interesting property of this new function is that T (D, 1;Q) = T (D ;Q), since 
Y, Na,(d?,1) = N'av(d?). 
Iz1 


THEOREM 12. The 2-dimensional error probability of a multidimensional constella- 
tion Q is upper bounded by 


1 eT(D,L;Q) 


nosy а 


L=1,D=Dp 
where T (D,L ;Q) is the transfer function of Q and Dg as in Lemma 7. 


proof. We shall follow quite closely the proof of Theorem 1. Let L be the number of 
erroneous symbols after decoding. The average number of faulty symbols per signal 
(N-dimension) is 


M-1 
1 
E(L)= Y P(s;) E(L |s) = M У, Ей). (50) 
i=0 i 
We define then the following sets, E;; := (U sj | du(s;, s) 21, OSsi S M-1,0s1 


S N/2, where dy(s; , sj) is the Hamming distance between the signals s; and s; in 
terms of its constituent 2D symbols. We can, therefore, write 
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NR 
Е( |5) = Y IP(decseE;). (51) 
1-0 


Defining the associated index sets as Т; ; := (/е0,1....,М- | dy(s; , sj) = L}, we thus 
have: 


P ( dec se Ei) =P (y dec s). (52) 
дет, 


Again, we can build a partition on the index set according to: 
T$, = (je0,1,.,M-1| dus, s) =1 (x Us. 5) = d?), d? > 0. (53) 


Applying this partition оп the index set yields E;; 2 (y W, 5j. Now, the union 
4-4... j€T 1 
bound results in 


NO а 
ЕС 5) = У X Y, Pos. (54) 
7 10 dd, јет 
We shall denote by N;(d2,)) := |T2;| the cardinality of the set T$. Certainly, 
Y, Ni(a?,1) = N;(d?). 
1 


By the same token as Theorem 1, it is found that 


М/2 du 
E(Ll)sY Y 1Mi(a?,1) еа?) (55) 
120 dd 
and finally, 
м2 Я 
ЕШ) <У Y !Nnía?,!) e(d?) (56) 
1=0 do 


M-1 
where Ns, (d?,1) т ў Y №(а?,1) is the average number of pairs of signal having 
i=0 


both squared Euclidean distance d? and / distinct symbols. 
By using the exponential bound on the erfc(.) function, (56) can be rewritten as 


deux м2 aide 
Е(1) 512 У Y 1 Ns (2, р“ |p=0, : (57) 
d=d ms 1=1 


On the other hand, it can be seen from definition 5 that 


. d max NR 2,42 
TELE) = E > l NS G2, р“ I^ LA, (58) 


Comparing (58) and the right hand side of (57), we recognize that 


EL) < 1/2 TOL :2) . (59) 
L=1,D =D 
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E(L) 


N2 so the 


Furthermore, the symbol error probability can be found to be P, (2) = 
claimed bound follows. Q.E.D. 


LEMMA 13. The upper bound on thc 2-dimensional error probability (Theorem 12) is 
less than or equal to that on the N-dimensional error probability (Lemma 7), that is, 


1 aT(D.L;Q 
= TELE <12 томға) pidas 
L=1,D=D, 





proof. Using definition 5, bound (35) on the N-dimensional error rate can be rewritten 
as 


P,(N) S V2 T(D,L;Q)| L=1,D=D, - (60) 
Furthermore, it can be noted from (58) that 
: . 2,2 
TOLD рур X YEN? Doe (61) 
dL du dads, ізі 





since | < N/2 always holds. Accordingly, the asserted inequality follows by dividing 
both members by N. Q.E.D. 

In the following, these results are applied to multidimensional constellations with ran- 
dom coded modulation. 


THEOREM 14. The symbol error rate of multidimensional random coded constella- 
tions is upper bounded by 
[72(Do) -1] 


Р,(2) S V2 T2(D0o) 2. 
(2) s 1/2 T4 o)" Tij) 


proof. First, we consider the constituent 2-dimensional constellation Оз. We introduce 
then the two-variable transfer function in agreement with 


T(D,L;) =L T(D;). (62) 
Consequently, the associated complete transfer function is 
T2(D,L) = 1 + L[T2(D) - 1]. (63) 


Obviously, one has T2(D, 1) = T2(D) as expected. We go further to N-dimensions and 
calculate the complete transfer function 


Ty (D,L) = 1720,1) (64) 
so we obtain an expression of the transfer function in terms of its 2D constituent: 
T(D,L;Q) = [T2(D,L))"? - 1. (65) 


In order to apply Theorem 12, we take the partial derivative of the above function 
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with respect to L, resulting in 


oT(DL;Q) М NR- oT 4(D,L) 
NX NER GUT [72(D,L)] I · (66) 
Furthermore, it can be seen from (63) that 
OT 4(D.L) 
rd À ra = " 7 
ЗІ, T2(D)- 1. (67) 


L=1 


Therefore, the result follows by inserting (67) into (66) and then applying Theorem 12. 
Q.E.D. 


This can be illustrated by the example of the random coded constellation with a 4- 
point constituent 2D constellation. In that event, we have T2(D,L) = 1 + 2DL + 1D 2L. 
For N = 4, for instance, it follows that T4(D,L) = 1 + 4DL + (2L+4L?)D? + 4D3L? 
+ 1041,2. The bound on the symbol error rate resulting from the previous theorem is 
P.(2) < Do + 2.505 + 2$ + 0.5D$. 


IV.2.5. ASYMPTOTIC BEHAVIOUR OF VERY LONG CODES 


"Virtually all large coded constellations are good 
because they are essentially identical", Н.М. de OLIVEIRA. 


Another question which should be addressed is about the famous statement "(almost) 
all codes are good", now thinking of the coded modulation context. We present below 
a straightforward theorem which clarifies this point. 


THEOREM 15. (ALL CODED CONSTELLATIONS ARE GOOD) Given an arbi- 
trary E > 0, if we pick at random a particular coded (redundant) signal set 41 with 
length Ne, then almost surely (a.s.) it is a good one (that is, PEN) < £), provided 
R« Ro. 

proof. Тіс theorem оп Ше partial cut-off rate asserts Ша 
Р.М) S exp; (-N[Ro(N) - R]). Applying then Definition 2, it follows readily that 
jim PeW ) = 0, provided R « R o. Therefore, recalling (14), we can write 


imm = А 1 2 #1 
= — №) = 0. 
jim Р,(М) Jum jim L EC )=0. (68) 
Changing the order of the limits, we get 
"e E DP | " 
lim I 2 lim Р? (№ -0, (69) 


still assuming that R < Ro. 
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On the other hand, given € > 0, we define bad and good sets, respectively, by 
B,(L) := (161,2,.,L | lim PZ(N) > £} 
N>% 


and 


GC) = (1€1,2,..L | lim РМ) < e). 
Ne 


Thus, the bad set is an index set pointing out all the codes for which the ND-error pro- 
bability is not arbitrarily small, as the dimensionality increases whithout limit. Of 
course, (Ve) |B¿(L)| + |G¿(L)| =L since every code is either good or bad. Let В, 
(resp. С.) be the bad (resp. good) set when L increases indefinitely. Accordingly, 


за ЗЕ | , РТ | Ico 
- = N lim — {|B,(L)|.e+ L)|.0} . 70 
0 Ber Em Pey е Bm Al e(L)|.e + |G_(L)|.0} (70) 
Furthermore, |B,(L)|/L converges a.s. (by the strong law of large numbers) to the pro- 
bability of taking a bad code, P (B,), that is, jim ІВ ¿(L)| .LOzP(B, as. 
— 99 

Hence, we find out P (В:)е S 0 a.s. which implies P (В:) = 0 a.s. Thus, except for a 
set of measure zero, all the codes have vanishing error probability as N goes to 
infinity. Q.E.D. 

Indeed, like the random codes, random coded constellations are not uniformly 
good but similar remarks ([15], p. 39) can be made. 


COROLLARY 16. Almost all coded constellations exhibit virtually the same perfor- 
mance, provided their number of dimensions is very large. 

proof. Consider two arbitrary codes, denoted by the superscripts #i and #j, respec- 
tively. We shall prove that almost surely |РҰ(М)- P#/(N)| Se when N=. Con- 
versely, assume that |PÉ(N) — PÉ(N)| > e. Without loss of generality it may be 
assumed that P#(N) > P#/(N) so that РМ) > e + P#/(N) > е. Hence, at least one 
of the two codes must belong to the bad set when n increases indefinitely. Therefore, 
Р (|Р (М) - Pf(N)| > €) <Р (iujeB¿) < 2Р (B) which goes a.s. to zero and our 
claim follows. Q.E.D. 


Any open interval on the real line is denoted henceforward by an open ball of center K 
and radius к, B(K,x)-(8?| |82-K |<к), and its complementary event by B*(K, к). 


LEMMA 17. Almost all constellations exhibit the distance hardening phenomenon as 
their dimensionality increases indefinitely. 
proof. Let К = E (5?) and an arbitrary к > 0. We want to show that a very long code 
picked at random satisfies P"(|B2— E(8?)] > x) = P*(8? in В (К,к))->0 as. 
From (16) and Definition 1, we have 

= L 

Р (6?) = lim + y P8). (71) 

I=1 


Lo 
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Summing up for any 8? е B“(K,x) and changing the order of summations in the 
right-hand side, we get 


= L 
Р (8? in В К,к))- Jim + y, P*(8 in B°(K,K)). (72) 
959 l=1 


When N increases without limit, Theorem 11 implies that 
y c Н #82 + pe E 
Jim jim, L 2 P” (64 in B*(K,x)) = 0. 

Now the proof follows quite close to that of Theorem 15. We define here the bad 
and good sets to be, respectively, 


B, (€) = (l=1,2,....L| lim P*(& in В К,к)) > €) 


and 
Сі(е) := (121,2,...,L | Jim P*'(8 іп B°(K,x)) SE}. 


The proof is then completed by the same reasoning as for Theorem 15. Q.E.D. 


DEFINITION 6. Given е > 0, two discrete distributions P " (x) and P “/(x) are said to 
be e-indistinguishable iff one has 


(У KeR) (V x50) [Р * (x in B (K,x)) - P* (x in B(K,«))| < €. 


We can see the e-indistinguishability as a binary operation between distributions which 
will be denoted by ~,. Further properties of this relation are presented in Appendix В. 


DEFINITION 7. (QUASI-IDENTICAL CODES): Two coded signal sets denoted by 
superscripts 4i and #j are said to be identical within € (quasi-identical) iff their nor- 
malized squared distance distribution are e—indistinguishable. 


The relation ~, asymptotically induces an equivalence relation among codes as N 
increases (see appendix B). In the following we show that all large constellations 
become equivalent in the above sense. We adopt Sup (resp. Inf) to denote the least 
upper bound (resp. greatest lower bound). 


THEOREM 18. For any е > 0, almost all codes (coded constellations) are quasi- 
identical to the average code (random code), provided their dimensionality N is very 
large. 

proof. We pick at random a redundant constellation (superscript #1) on the assump- 
tion that the dimension is high enough. We intend to apply P2 (Appendix B) to show 
that P* (8?) ~, P(8?). Given any x >0, we begin by splitting R* into two sets, 
namely 


Rb = (KeR* | E(8%)eB“(K,x)) and RÝ :={KeR* | EG)eB(K,x)) . 
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Now we must evaluate 


#052 ; Pi; = Мах, Sup Fx(K) (73) 
Mex Sup |P "(6 in B(K, к) - P? in ВСК, X)| =, Мах, Sup Fx 


Firstly, we carry out the supremum of Ғ.(К) on Ro. In this case we have 
< Sup PR in B(K,K)) + Sup P ін В(К,к)). (74) 

бар ЕК) < e (9 іп B (K, к)) keke 
‘It follows from the squared distance hardening properties (Theorem 15 and Lemma 


17) that 
Sup Fx(K) < £24 E8256 аз. (75) 
КеКо 


Secondly, we carry ош the supremum of F (K) on Rj. Now we use the fact that 
Sup |1 — P^ (8 in B(K,x))| + Sup, || - P(& in В(К,к))| (76) 
Sup F«GO s Sup | (8^ in В(К,ҡ))| PR | 
yielding 
Sup F,(K) < ( 1- Inf, P (8? in B(K,x)) ) + ( 1- Inf, P(& in В(К,к))) (77) 
Keke KeR, KeR, 


Once again, hardening properties lead to 
Sup F,(K)SE2+E2SE a.s. (78) 
Ke I 


The proof is completed by combining (75) and (78) with (73). Q.E.D. 
This theorem has the following corollary: 


COROLLARY 19. Almost all codes become quasi-identical for апу е > 0 as N 


increases without limit. 


proof. Consequence of both the above theorem and the asymptotic transitivity pro- 


репу on P3 (appendix B). Q.E.D. 


IV.2.6. A GALLAGER TYPE BOUND FOR CODED MODULATION 


In this section we intend to derive upper bounds on the error probability of 
finite-dimensional coded constellations with equally likely signals which are, in many 
ways, similar to those by Gallager [16]. They therefore generalize bounds established 
in the previous sections. In particular, attainable limits on the performance of coded 
modulation signals are studied. A family of generalized union bound is introduced 
which results in an Ep function that allows to support rates beyond the cutoff rate. We 
define a capacity (and a cutoff rate) of coded finite-dimensional signal sets as the rate 
that cannot be exceeded by these systems provided that the error probability can be 
made arbitrarily small. 
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The idea here is to generalize the union bound and then apply these results to 
evaluate performance of combined coding and modulation schemes previously 


described. First, we shall need some useful inequalities given by 


PROPOSITION I (INEQUALITIES). Let / be a countable index set. Апу sequence 
{xj };<; of real numbers verifies the following inequalities 


1 
@ УЫ Р P vpao, 
il іші 


1 
Gi) YlalalYE dal"? Ур:-1<р<0. ШЫ 
isl isl 
These are well known inequalities (see e.g. [18], p.197). Nevertheless, we propose an 
alternative proof of them in Appendix C. 


PROPOSITION II. Let (х;);-/ be a sequence of real numbers and let (7;);-; denote 
a sequence of positive integers, n; 2 0. Then for any p > 0, we have the inequality 


1 | pti 
X nilu| < | Y, nix’ 
iz іш 


Proposition I above тау be applied in conjunction with the union bound in order to 
derive a family of upper bounds on the probability of a union of events. To begin 
with, let (P (Aj))je; be the respective probabilities of events (Aj) je. 


Consequently, we can easily infer from part (i) of Proposition I that, for any p 2 0, 





A. |р+ 
NPA)S| EPA) d (79) 
jel jel 
So we have established the following family of bounds: 


PROPOSITION Ш (GENERALIZED UNION BOUND). Let (А) ег be an ensemble 
of (not necessarily disjoint) events. Then the following bounds hold for any p 2 0: 


P (U Aj) 5 
jel 





—L |p# 
> Р(А;) 1% и 
jel 

Clearly, the union bound is the particular case corresponding to p = 0. Also, we get 
some kind of Bhattacharyya-union bound for p - 1, namely 


P(A) < X, X, VP ADP (4). (80) 


jel iel jel 


Furthermore, we mention that most bounds in this family are strictly weaker than the 
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union bound. However, this is not inconvenient for one who wishes to study the per- 
formance as rate increases towards capacity. We discuss now this point. 


There are two different ways to think about powerful bounds like Gallager's. 


First, we may say that the Bhattacharyya-union bound does not allow to achieve 
capacity because it is not a very good upper bound (it is too loose), so we need tighter 
upper bounds. This seems to be the thinking of most researchers. They consider 
Gallager's bound tighter than the Bhattacharyya-union bound although both coincides 
in the range of rates where the latter is remains valid. The former also holds in a con- 
siderable range beyond the cutoff rate. However, considering the family of bounds as a 
function of p without carrying out optimization with respect to this parameters, most 
bounds are weaker. 


As a second approach, we examine the close relationship between the transmis- 
sion rate R and the error performance P,(N). Indeed, rising the transmission rate 
increases the error probability. Therefore, making severe constraints about the way in 
which the probability of error goes to zero, forbids us to handle very high rates. In 
other words, one should slack constraints about the way that the error probability goes 
to zero in order to allow higher rates. Hence, we need weaker bounds than the 
Bhattacharyya-union bound to achieve capacity. For very-high rates (above the critical 
rate), the Bhattacharyya-union bound is no longer valid, that is, there exist no codes 
having such a behaviour of decreasing error rate. In contrast, Gallager bounds show 
the existence of codes with vanishing error probability. 

Accordingly, we prefer to use the term "more general bounds" rather than "tighter 
bounds", although both interpretations are correct. 


Now we consider (coded) finite-dimensional constellations with M equaly likely 
signals on an additive white Gaussian noise (AWGN) channel. Again, by abuse of 
language, а coded constellation will be referred to indistinctly as a code. 


LEMMA 20. The N-dimensional (block) error probability P, (№) for a particular code, 
say with superscript ЖІ, is upper bounded by 
P#(N) < exp; -N ET(R,N) , 
where EU (R,N) := Sup [-рА + Ef (p,N)] is a reliability function of the code, namely 
> 
jy JP" 
| 1 pire #2 (121% 
ESPN) = – log Y | X, Prde’) 


i=0 |4-4., 


where e (d?) denotes the pairwise error probability of any pair of signal points whose 
squared Euclidean distance is d?. 
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Some comments would be worthwhile. First, note that each code has an upper bound 
expressed in the above form. We are especially interested in examining bounds result- 
ing from random coding which represents the average behaviour of the family of codes 
considered. Additionally, these bounds are based on the spectrum of the random code 
which is simpler to obtain. Secondly, we mention as a particular case a 
Bhattacharyya-union type bound which corresponds to let p = 1 


PEN) < expa-N [REUNIR], 
where we have defined a code cutoff rate according to 
RB (N) := ES (LN). 


It should be pointed out that this definition is close to the one of the conventional cut- 
off rate Ro. 


We feel that this bound is tight for very high dimensional codes, since it is an 
exponential bound on the (block) error probability provided that R does not exceed C. 
Such bounds are, therefore, interesting in order to analyse the asymptotic behaviour of 
very long codes. Indeed, they are not very tight for short codes. Moreover, these are 
bounds on the error probability of a given code #/. However, it is quite difficult to cal- 
culate bounds for particular codes. Hence, we should consider the random coding 
which deals with all codes. 


IV.2.7. CONCLUDING REMARKS 


We applied Shannon's random coding argument to coded modulation. Upper bounds 
on the block and symbol error probability of finite-dimensional constellations have 
been developed. We defined a partial cut-off rate in terms of which we can upper 
bound the average error probability. An open problem is the relationship between the 
cut-off rate Ко and the conventional cut-off rate Ro [16]. A more general upper bound 
than union bound should be used to allow for higher rates. Added to that, we mention 
that Hughes’ cone bound [17] could be used instead of the union bound in order to 
improve the error probability estimation, especially for short codes. 


Concerning the squared Euclidean distance distribution, parameters like its first 
two moments have been calculated. Finally, the asymptotic behaviour of such systems 
has been investigated. We have found that a hardening phenomenon occurs with the 
normalized squared Euclidean distance. We have also shown that virtually all large 
coded signal sets are good with probability asymptotically approaching one provided 
the rate does not exceed a critical value. The investigations carried out in this paper 
provide a better insight into the performance of multidimensional coded constellations. 
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APPENDIX A 


DETERMINATION OF THE TRANSFER FUNCTION FOR THE 
CONSTITUENT 2D CONSTELLATION 


We intend here to clarify the process for determining the finite theta series/transfer 
function of a constituent 2D constellation. The set of the distances between two arbi- 
trary points in the 9; constellation is denoted by A((22). [AOnce the number of signal 
points with a particular squared distance 42е А(О;) to a given point may vary with 
this point, we are led to consider a matrix [N ](d?) which exhibits the number of 
points at a squared distance d? from each signal point. The average number of signal 
pairs with squared distance 42, N ,,(d2), is found by averaging all the elements in the 
[N ](d?) matrix. Thus, finite theta series and transfer functions can easily be deter- 
mined according to Definitions 2 and 4. This process is better understood by consider- 
ing representative cases: the following concerns particular signal sets, namely 
square/cross M-ary QAM. Moreover, we assume do = 2 for convenience. 


CASE 1: |9; | = 4. The complex constellation (4-ary QAM) is represented by the fol- 
lowing matrix of coordinates 
ED (1,1) 
(92) = ee ( I 


We have A(Q,) = {0,d3,2d3 }, and the neighbourhood matrices are 
11 2 22 2 1 1 
[N ]00) - 11 [N (a5) = 22 IN ](2d5) - 111: 


The finite беа. series fe for this signal set is, therefore, expressed by 
Oo, (z) = 1 + 2% + Iw so Ше complete transfer function is 
T2(D) = 1+2D+1D?. Additionally, we notice that [N ](0) has all its entries equal to 


unity for any kind of signal set, so Na (0) = 1 as expected. 
CASE 2: |9; |-16. The complex constellation matrix for 16-ary QAM is given by 
3,3) CL3) (1,3) (3,3) 
C3 1) C11) (1,1) (3, 1) 
[= (3-1) 1,2 (1-1) (1-D|* 
(-3,-3) (-1,-3) (1,-3) (3,-3) 
It can be readily checked that 
А(0,) = (0, d3, 22, 444, 544, 848, 94, 1043, 1348, 184). 
The respective neighbourhood matrices for every d?e А(О)) are: 


2332 1221 222 

2 3443 2 2442 2 222 

[N ](d0) = 3443 00245) = 2442 [N (4%) = 222 
2332 1221 222 


NNN м 
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2332 1111 2112 

2 3443 2 1111 2 1001 

[IN (56) = 3443 [N](846) = 1111 [№ (9%) = 1001 
2332 1111 2112 

2222 2112 1001 

2 2002 2 1001 2 0000 

ІМ (100) = 2002 [N]a3a$) = 1001 [N ](18d5) = 0000 
2222 2112 1001 


The values of N (d?) for d?e A(Q) are computed by averaging all the elements in 
the corresponding matrix, as previously described. 


A SECOND EXAMPLE: 


C. C$ 5 CL5 (1,5) (3,5) (-.-) 
(-5, 3) (-5,3) CL3) (1,3) (3,3) (5,3) 
(55. 1) C3, 1) (1,1) (1,1) (3,1) (5,1) 
I] = —5,-1) (-3,-1) (-1,-1) C 1,-1) (1,-1) (5,-1 
-5,-3) (-3,-3) (-1,-3) (1,-3) (3,-3) (5,-3 
E) (-3,-5) (-1,-5) (1,-5) (3,-5) (-.-) 


It can be rar cheeked that 
лоо, = 10,d3,2d3,4d2, 53,843,942, 1042, 1347, 1643, 183,2043,2543,2643,29d4,32d5, d t. 


The respective neighboorhood matrices for every d?e А(О;) are: 


2332 2222 2222 4 
44442 3443 23322 

Же? 44443 ; 4444 : 34432 
(4) 7544443 ІМІ240 =р 4444 INJAd) 7p34432 
44442 3443 23322 
2332 2222 2222 
3443 1221 2112 
45543 112211 2222 

| 5885 А 2332 ; 22221 
16%) = 5885 ІМ((840) = 2332 IN]Oa5) = 22221 
45543 112211 2222 
3443 1221 2112 
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APPENDIX B 


PROPERTIES OF THE RELATION ~, 


We present here a few properties of the relation ~, involving the definition of 
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£-indistinguishable distributions. 
P1. If P fi(x) ~e při (x) then it follows that P fi(x) ~e p*i (x) provided е; > ғ. 


P2. A necessary and sufficient condition for two distributions to be e~indistinguish- 
able is that Vx > 0 


бшр |Р #i(x in B(K,X)) — P*(x in В(К,к))| < е. 
€ 


P3. The relation induced by e-indistinguishable normalized squared distance distribu- 
tions is asymptotically an equivalence relation, that is, 

а) ~e is reflexive, b) ~, is symmetric, c) ~, is asymptotically transitive. 

proof, а) and b) are trivial. To prove с), given e > 0, there "id М large enough such 
that Р“, Р* and P*/-., P* Now Р*!-, P* and P*/~, P** follows from Pl. 
The asymptotic transitivity follows from P2 and the triangular n 


APPENDIX C 


Proof of Proposition I. The reasoning used here follows Gallager [16]. Clearly, for 
any p 20, 

Eb?) рр 

jel 


Ф; = E" 21, (СІ) 
and therefore, 
L A.P 
Y lx; | SE |x;|®; = > Lo] "e Б mi | (C2) 
ie je 


so part (i) follows. 
Furthermore, we һауе from the above that, for any 0 < В < 1, 
vg 
EbxsiXE A] . (C3) 
iel iel 


Considering a given sequence {y;};ey, we apply then (C3) to |x;|-|y;|!P, which results 
in 


vp 
x у < > bil for any 0 < ps1. (С4) 
г i€ 


The proof of part (ii) is completed by letting В = 1+p (-1 < ps0). Q.E.D. 
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Proof of Proposition II. Define a new index set /’ with cardinality |7 |=(У, n;) which 
ігі 


contains / but where the element і is repeated n; times. Now 
-1 ры 
Y м1 = У kls Б mr | , (С5) 
іші ir izr 
where the inequality follows from Proposition I. The proof is completed by changing 
the index set from Г to]. Q.E.D. 


Proof of lemma 20. The error probability of a code #/ can be evaluated in terms of 
the conditional error probability given that a particular signal s; is transmitted, i.e., 


MA | 
PHN) = Y, — P (elsi). (C6) 
ia М 
The conditional error probability can be bounded by a (generalized) union bound as 
follows. Let 5; — s; denote the event decoding s; when s; is sent and s; is considered 
the only alternative. We suppose that Maximum Likelihood Decoding (MLD) is car- 
ried out by the decoder which is optimal in the sense that it minimizes the error rate. 
We also consider an index set TÍ defined as 
Т? :- (je€0,1,.,M -1 | j#i , 4%;,5/)-47). By a union bound argument, we find ош 
Ре Y EP Gp, (С?) 
d=dui JET: 
where P *! (sj 5j) is the pairwise error probability which solely depends on d? but not 
on j. We denote by e (d?) the pairwise error probability of any pair of signal points 
whose squared Euclidean distance is d?. 


Let Nf(d?) := |T?| denote the cardinality of the set ТЇ, that is, the number of signals 
at a squared distance d? from Si. Applying then Proposition II to (C7), we get 
j |а 
P(els) s x М/(аЗеа9 | y Nf d e(a?) (C8) 
~ а=4 d=d min 


Thus, a bound on the block error probability of a code can be found by inserting (C8) 
into (C6). This can be rewritten as 
|?" 


P"(N)sM? y | y, PH aed) | , (C9) 
і=0 |4-4,, 


where Pf(q?) = м” '(d?)/M is the (conditional) distance spectrum of the code ЖІ, still 
assuming that p 2 0. 


We now define a so-called Gallager function Ей (р.№), 0 S p < оо, according to 
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M-1 1 Іш 

1 » zie 

Е (ЫМ) ==> log Y | E Р а?)е(а?) "e (C10) 
i=0 |d=dan 


(compare, for instance, with the Eo(.) function defined by Gallager on a discrete 
Memoryless Channel ([16])). 


Remembering that M = exp? (NR), it follows promptly that 
PUN) < exp, -N [-pR + ED (p,N), 0<р «e. (C11) 


Finally, we can choose the tightest bound by maximizing the term into brackets in the 
above expression according to 


ET(R,N) = Sup [-pR + ЕЎ (p.N)], (C12) 


and the proof follows. Q.E.D. 
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o HN 


о q-point 
Constituent constellation 





N-dimensional signal space 


Figure 1. N-dimensional constellation created by taking the Cartesian product of a 
constituent 2-dimension constellation with itself N/2 times. 
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Figure 2. M-point QAM constituent 2-dimensional constellations and their respective 2- 


dimensional transfer functions 
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Figure 3. Evolution of (normalized) squared Euclidean distance spectrum of random 
coded constellations based on a 16-QAM constituent constellation for increasing 


dimensionality N. 
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Conclusions et perspectives 


CONCLUSIONS. 


L'évolution vertigineuse des débits exige que les systèmes numériques 
disposent de schémas de codage de canal de plus en plus performants. Les modulations 
codées sont apparues comme une réponse à ce phénomène et constituent maintenant un 
acquis définitif. 


Les principaux résultats obtenus au cours de cette thése peuvent étre résumés 


-Un algorithme de détection pour la modulation MAQ au sens étroit. 


-L'utilisation d'un canal secondaire opportuniste pour des constellations 
bidimensionnelles en croix généralisées ainsi que des bornes sur ses performances. 


-L'étude du codage en treillis combiné à la modulation MDP différentielle. 


-La démonstration sans équivoque de l'existence de moyens déterministes pour 
s'approcher de la capacité. 


-La détermination d'une fonction de fiabilité pour les codes de réseau sur le canal 
gaussien. 


-Des bornes supérieure et inférieure sur les performances de codes de réseau en 
fonction de leurs paramètres ainsi que leurs limites asymptotiques. 


-Une discussion et une conjecture sur les rapports entre la capacité et les 
problémes d'empilement de sphéres et de recouvrement de l'espace euclidien (questions 
fondamentales pour éclairer la nature de la capacité). 


-L'étude de la modulation codée aléatoire selon la méthode introduite par 
Shannon. 


-Le calcul du spectre de distance euclidienne des constellations codées aléatoires à 
partir de la série théta finie. 


-La mise en évidence du phénoméne de durcissement de la distance euclidienne 
normalisée dont on montre qu'il est l'équivalent, pour la distance euclidienne, de la borne 
inférieure de Varshamov-Gilbert pour la distance de Hamming. 
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A l'avenir, il serait intéressant aussi d'étudier soigneusement le comportement des 
régions de Voronoi de réseaux dont le nombre de dimensions est trés élevé. On remarque 
l'importance du fait que “la presque totalité du volume d'une région convexe est 
concentrée sur sa surface". Néanmoins, la connaissance des phénoménes dans un espace 
euclidien à grand nombre de dimensions est loin d’être une tâche aisée. Leurs propriétés 
sont trés différents de celles de l'espace que nous habitons. Ces espaces sont, en effet, de 
véritables boites à surprises ой beaucoup de phénoménes échappent à notre sens (voir, 
p.ex., le chapitre 9 de [HAM 1980]). 


Une perspective digne d'attention serait l'interprétation des codes MCT comme des 
empilements de nombre de dimensions infini et invariants dans le temps. Il serait fort 
utile, d'un point de vue théorique, de démontrer un théoréme de capacité pour le codage- 
modulation еп treillis aboutissant à une expression explicite de leur fonction de fiabilité 
dans un canal à bruit gaussien additif, comme nous l'avons fait pour les réseaux. Bien 
qu'elle paraisse une constatation presque évidente, la supériorité des codes MCT sur les 
codes de réseau devrait exiger une analyse plus profonde, démontrant et quantifiant ainsi 
leur supériorité sur des constellations codées de dimension finie. 


Rien n'empéche par ailleurs d'envisager d'appliquer le raisonnement utilisé pour 
obtenir le spectre de distance euclidienne des constellations codées (section IV.2) à la 
détermination de celui des modulations codées en treillis aléatoires. 


D'autre part, l'emploi du choix aléatoire s'est montré une stratégie trés riche et 
toujours utile pour l'étude des limites ultimes (codage de canal, minimisation de circuits 
booléens, etc). Il se pourrait que les idées exposées dans cette thése puissent servir à 
trouver une borne sur la densité limite de réseaux à grand nombre de dimensions. А cet 
égard, il conviendrait de rappeler que l'empilement aléatoire à trois dimensions [BER 1969] 
présente une densité de 0,64 alors qu'elle vaut 0,74 pour les empilements les plus denses 
connus (p.ex. le réseau cubique à faces centrées, empilement hexagonal rapproché). On 
peut s'attendre à une diminution del’écart entre la densité d’un empilement aléatoire et 
celle du meilleur réseau au fur et à mesure que le nombre des dimensions croit. 


De méme que l'on a généralisé la série théta aux constellations bornées, il est 
possible de définir leur densité comme la fraction de la région bornée recouverte par des 
sphéres. La détermination d'un moyen de calculer la densité d'un réseau (constellation) 
en fonction de sa série théta (finie) pourrait aboutir à un calcul de la densité des 
constellations/empilements aléatoires. On pose alors la question de l'existence d'une 
limite à la grandeur ci-dessous et, si la réponse est positive, de son rapport avec la densité 
de centres : 
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©, (0 
5(A) = 8(A:Z") 19,0 
Ozn(0) 


Si la modulation codée paraít d'une extréme fécondité, on constate tout méme une 
certaine difficulté à progresser à mesure que l'on considère des codes très longs. Cette 
difficulté n'est pas encore vraiment ressentie à présent parce qu'elle apparaîtrait dans la 
conception de codes beaucoup trop longs pour que la technologie actuelle en permette la 
réalisation. D'ailleurs, un changement profond dans la conception et la philosophie d'une 
théorie fortement établie n'est obtenue qu'aprés une longue démarche. Dans notre 
contexte, rappelons les réticences de la communauté scientifique à accepter les idées de 
Shannon et d'Ungerboeck. 


Il paraît exister une incompatibilité fondamentale entre les bons codes (au sens 
d/n + 0) et leur structure mathématique [COF&GOO 1990]. Cela expliquerait pourquoi on 
ne trouve pas de bons codes. А ce propos, on pourrait proposer la comparaison suivante: 
faire correspondre les codes structurés aux nombres rationnels et les codes sans aucune 
structure à l'ensemble des irrationnels. Ayant associé la mesure de Lebesgue à l'intervalle 
(0,1), la probabilité de choisir au hasard un nombre irrationnel (code non structuré) tend 
vers 1 alors que les nombres (codes) que nous concevons sont normalement rationnels 
(structurés). Il est donc facile de concevoir des codes structurés - probablement mauvais 
au sens de la distance minimale- quoique la presque totalité des codes soient bons. La 
démonstration de l'existence de bons codes de réseau n'est probablement pas en 
contradiction avec la discussion ci-dessus. En effet, si ces codes fortement structurés sont 
bons, c'est seulement en ce sens que leur probabilité d'erreur est petite. Cependant, ils ne 
sont probablement pas bons au sens д/п -^ 0. La figure 7 (IIL.2) paraît traduire les 
principaux résultats de cette thése. En interdisant quelques points, on pourrait obtenir des 
codes bons méme au sens de la distance minimale (cette opération consiste à transformer 
un code bon en un code uniformément bon [ELI 1955]) en ne diminuant que trés peu le 
débit d'information. Mais le prix à payer serait alors la perte de la riche structure 
niathématique. Battail propose en quelque sorte d'oublier le critére de distance minimale 
et de traiter des codes bons (mais non uniformément bons) pour conserver une structure 
favorable au décodage. 


Ainsi, les contributions de ces travaux confirment l'intérét de poursuivre l'étude 
de codes de réseaux (et de classes latérales) non seulement pour aboutir à une meilleure 
compréhension de 1а philosophie du codage, mais également pour permettre d'envisager 
des solutions pratiques pour l'avenir. 
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Sur la Théorie des Systàmes de Modulation Codée 
pour la Transmission Numérique à Débit Elevé. 


Le début est consacré à un арегси historique et le reste à des 
contributions personnelles. Le problème de reconstituer la phase de la 
porteuse a été envisagé pour les Modulations Codées en Treillis (MCT), 
aboutissant à une MCT différentiellement cohérente: Un étiquetage binaire 
optimal des symboles d'une constellation carrée a été introduit et une 
famille de constellations en croix généralisées étudiée. Des bornes fines 
de leurs performances ont été établies et leur efficacité spectrale a été 
évaluée. 


Utilisant le théoréme de géométrie des nombres de Minkowski- 
Hlawska, on a démontré un théorème de capacité pour le canal à bruit 
additif, blanc et gaussien, établissant ainsi l'existence de moyens 
déterministes pour approcher la capacité. 


Des bornes sur les performances des codes de réseau ont été 
obtenues. Une amélioration de l'approximation continue de Forney pour 
estimer la puissance moyenne normalisée à 2 dimensions a été suggérée. 
On a analysé le comportement de ces bornes pour un grand nombre de 
dimensions et conjecturé que s'approcher de la capacité est lié à la 
recherche de bons recouvrements plutót qu'à celle d'empilements denses. 


On a appliqué le raisonnement de Shannon basé sur le codage 
aléatoire à des constellations de nombre de dimensions fini. Les spectres 
de distance euclidienne de telles constellations ont été calculés. Un 
phénoméne de durcissement de la distance a été trouvé. On a montré que 
l'affirmation "tous les codes sont bons" reste vraie pour les constellations 
codées. 
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